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第 0 章复习及其他 


0.0 导引 

本京的目的是简耍地编撰许多有用槪念或 结果. 不加证明，其中许多概念和结果 a 接或间 
接地为涉及本书主要葶节的内容莫定 r 基础.所编写内容的大部分可能以某种形式包括在线性 
代数的基础教程中，另外 • 还选编 r 一些冇用的资料 • 这些资料往往不易在其他地方找到，或 
荇不宜安排在以后的章 sv 中.这样，在歼始学习本书之前，这一章蚵作为读者的 sy 提要，必 
要时也为读者参阅有关资料提供方便.本章还规定 r •一些基本符号.并给出•一些定义；为此， 
r 解本章足有益的.这里 • 要求读者已经熟悉线性代数的基本槪念和矩阵的基本运算，如矩阵 
的乘法和加法. 

0. 1向量空间 

在本书的沦述中，虽然•般足含6地述及向 m 空间，但是，向«空间 fi 矩阵理论 的苺本 
结构. 

o . i . i 纯置域构成向 m 空间 的箪础是域，或荇是具有乘法的纯 a 集.对于实际应用来说•在 
通常的加法和乘法运裨下，祛 域几乎 •总是 实数域 K 或《数域 c (见附汝 A ). 但是. 它也可能足 \ ± 
有理数域，也可能是关于一个特定索数的粮数 m 余类域或一些其他的域.当未指明是哪种域 
吋，就 用符号 f 衣示域.为了验证一个纯研《是域，它必须在两个指定的二元运箅（“加法”和 
“乘法”） 下封 闭：两个运算必须满足结合律和交换律 • a 在该集合中各有一个单位元：对于所 
有的元家，在该集合中必须有关于加法运 w 的逆元素，并且对于除加法单位元 （ o > 以外的所有 
元素，在 w 叱合中有关于乘法运 算的逆 元隶； n 时，乘法运 w 对加法运算必须满足分配律. 

0.1.2 向 * 空间域 F 上的 向号空 间是一 咚对象（称为向 M ) 的集合 V ,它在一个二元运箅（加 
法）下封闭 • 这个运算娃结合的和交换的 • 在集合 V 屮有一个单位元 （“ o ”）， W . 有加法逆元. 
该集合对用纯 M 域 F 的元家左乘向.的运算也是封闭的， ft 有 性质： 对所有的《, /；6 F , 以及 
所有的 有 a(j + ).)= ci . r +“ jy ， ( u -^ b ) x : = ux -\- bj -, a ( bx ) = ( ab ) x , 以及对乘法申.位 

元 〆 6 F •有 f.r = x . 

对于给定的域 F ， 分 M 取自1*’的 w 元绀的集合足整数），在通常 的运算 （在 F " 屮按分 
M 相加）下构成 F 上的一个向 ft 空间.特别地， R ” 和 C " 是本书的基本向敏空间.具有实系数 
或 S 系数的（不超过某一指定次数的或任意次数的）多项式集合，以及区间 [>• 6] 匚 R 上的实值 
或复值连续函数，或任意函数的集合也是 （ K 上或 C 上） 向撤空间的例子.肖然，在有限维空间 
R ” 与… [ 0 , 1] 上的实值连续函数组成的无限维向 M 空间之间，有着本质的差别. 

01.3 子空间和张成向量空间 V 的子空间 U 是 V 的非空子集，它自身正好 是同一 个纯景域 
I .的向搶空间.例如[«，6, ()] r ： a . A 6 R 是 f 的子空间.通常，我们用某种关系来定义向 



1 空间 V 的子空 间， 如此得到的由 V 中部分元素组成的集合关于 V 中的加法是封闭的一例 
如. V 屮最 后一个 分量是0的所有元家组成的集合.一般认为，把所得到的集合看成一个子 
空间比 A 身 看成一个向蛍 空间®有用.在任 M 情况 F . 两个子空间的交还是 f 空间. 

如果 S 是向 M 空间 V 的子集 ， S 的张成 是集合 SpanS E V , + < i 2 7,2 +… + 心 W : “ i ， 
…， • i ， 2 , … • v * eS . k =\. 2, •••}• 注意，即使 S 不是子 空间 ， SpanS 总是 
〔2] 子空 间. 如果 Sp an< S = \/, 就称 S 张成向》空间 V . 

0.1.4 线性相关和线性无关 称一个 向擀空间中的向最组 U ,, ，…， x * 丨线性相关， 指的是 

在纯 附基域 F 中存在不全为0的系 数…， 使得 

ai . r , -f •• r ? 十…一 a k J t = 0 

或等价地，某一 向请 . r , MK 余向 W 的线性组合，其中系数取 fiF . 例如， {[1, 2, 3] T , [1. 
0, - i ] / . [2. 2, 2] M 是 K 的中线性相关组. V 中的一个子集在 F 上不线件相关 • 就说它线 
性无关. 例如， {[ I . 2, 3] T , [ I . 0. 一 1]0足屮中的线性无关绀. fi 要的娃要注意这两个 
槪念实®上与向燉绀冇又.线性无关的任一非空子集线性无关； {0} 珐线性相关 组； 因而，包 
含0向 Ift 的任一集合线性相关.可能一个向畎集线性相关，而它的任一啟子*钻线性尤关的. 

0.1.5 基设向 W •空间 V 的 如采 V 的每个元家 pf 以表示成 S 的漭元蒺（具有纯 Jrt 基 
域中的系数）的线性组合，就称 S ’ 张成 V . 例如 • {[1， （)• 0] T , [0, 1，0] 7 , [0, 0, 1]、 
[1.0， -llMftK I •.张成 R 3 (或在 C 上张成 C ). 张成向 撳空间 V 的一个线性无关组为 V 的 
•个基. 然 不迠唯一的. mas 很有用， v 的每个元家•能且只能用一种方式由基来表示， 
r 在该 苺中再 添加任何一个元蒺或从该基中*掉仟一元索， t 述件质不冉成 4. v 中的无关组 
MV 的••个 《• 仅与没冇 ft 包含它的尤 关组. 张成 V 的一个集合适 V 的一 个萆， 当 iL 仅 

丐它没荷真 f * 仍张成 V . 扭个向 尬空间 总有一个箪. 

0.1.6 扩充成一个基向贵空间 V ’中的任何线性无关组 都坷以 扩充为 V 的一个基，也就足•说， 
给定 V 中的线性无关绀 {. r , •.,，，•••• 在另外的向 ft . ~ ,，•••• . r ”，...6 V , 使得 {. r ,, 

J ，,. …}是 V 的一个苺，把一个巳知的无关织扩充为一个苺，3然不是唯一的[例如， 
可以把第三个分量是非零的任一向 M 添加到无关组 {[1, 0, 0] r , [0，1, 0] T } 中,便得到 R 3 
的一个祛]. ^[0, 〗]1:实饴连续函数绀成的实向《空问0；0， 1] 的例子说明，.一般地，一个 
苺未必 有限； rt 卜单项式{丨，^ …>组成的无限集是 c 、[ o . 1 ] 中的无关组. 

U ] 17 维数如果向耿空间 V ’的某个基包含有限个元家，那么所有的基冇相同的元素个数，并 
H . 你这个公共的数为向歌空 N 的 维教. 这时，就说 V 是有限维的，否则，就说 V 是无限维的. 
无限维的情形 （ 例如， r [ o , 1]>.在任意两个基的元素之间存在一个一一对应.实向 ft 空间 IT 
有维数”.向《空间 cr 在域 c 上有维 数”. 但在域 r 上有维数2 义 有时称基 { p ,, 

为 R ” 或 C ” 的标准基，其中^的第，•个分镟是1，其余分馕是 0. 

0.1.8 同构如果和 V 是同-•个纯 ft 域 F I •的向 S 空间 ， H /： 可逆函数，使得对 

所有的 * r ， 和所冇的“. b ^ F / ( a .? H - by ) = a /( r ) -*-/;/ ( v ). 则 / 是一个同构， [ i 称 1/ 
和 V 同构（“结构相同”>•同•个域上•的两 个釘限 维向蟥•今:间同构•当仅4它们有相 问的维 
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数： TM . 域 F 上的任一"维向鼠空间问构子 F \ 因此，任一《维实向迓空间同构于 IT , 而 
任一”维复向》空间同构 T - CT . 特別是 • 如果 V 是域 F 上的”维 向虽空 间，具有…个给定的 
K = u ，… • 那么，因为任一元素 * rev 可以唯一地写成 r = u ,. ri + … a , ei \ 
;=K 2,…，，/• 于是. 相对于这 个基. nf 以把 | 对应于”元组 [>], = [«,,•••• 对于任 

-个基.儿映射 . r -[. r ], 是 V 与 F 之间的一个同构. 

0.2 矩阵 

这里所研究的对象 of 以 Hf 两种1要的方式来 芍察： •.是把它吞成纯 tt 的矩形阵列，一足给 
每个空14指定…•个苺 • 然;^把它 fi 作两个向 M 空间之间的线性变换. 

0.2.1 矩形阵列-个轵阵是由域 F 中若 f •个纯钕织成的一个阵列 . ftllitt 7 W = W , 就称 
矩阵是方 阵. F 上的所釘川 x w 的矩阵集合川来表示，简记为 / W „( F >. 姑常 
见的情形适 F = C ( fe 数域〉.还把 M / C ) 简 id 为 M _( C ) 简记为 M _. 通常用大写字岈米 
表示矩阵.例如，如果 

9 3 n ] 

A= - T ° . 

1 7 T 4」 

耶么 A € M : .,( R ). - 个给定 矩阵的子处 阵玷位 T •该 S •:阵的一些指定的行和列的 炻形 阵列•例 
如•[穴, 4] 是上述 A 的子矩阵(位于第2行,第2 列. 第3列) • 

0.2.2 线性变换设【/和 V 分别是同一个纯 ft 域 F I .的 w 维向置空间和// I 维向嫩 空间; 设 .4, 
和 A 分别和 V 的堆. 我们 nr 以分別 / HM 构 . r — 和 .V 一 [>^把以和 V 中的向坩衣示 
成 f I :的"允织和 w 元纟 n . • .个线忡变换 K ： 一个函数 r : u -^ v . 使捋对于仔意纯 M ⑷和 a , 
以及向 ft A 和 . r 2 , TiatXt )=^, T (. r , )^ a 2 T ( j 2 ). —个矩阵 A € M „,.„ ( F ) 可以用 

K 述方 式对应于一个线性变換 r : U ^ V ： 向《7=厂(|>当付仅当这时就称 
矩阡 A 表示线性变换 n 关于坫备和木山丧示矩阵 A 与萆的选抒 有关. ft 讨论矩阵时 ， S 
意识到足在 讨论关于特別选定的苺卜的线性交换 • 但借助 F 什么娃，一般不必明言. 

0.2.3 与一个已知矩阵或线性交换相关联的向置空间不失一般性，使 F 上的 "维向 域空间与 
r 相对应 • 于是 • 就把 Ae / VCJFi 肴作从 F " 到 F ” 的线性变換（同时也宥作一个阵列）.这样 
-••个线性变换的定义域是 F % 它的值域是彳 . v 6 F '- v = Ar . 对所有了 eF '}. A 的零空间是 
U 6 F ": A.r = 0}. A 的 侦域是 F - 的子 空间 ， Ifli A 的零空 间娃 F 的子空间.关于这 W 个子空 
间的关系 式是: 

” = A 的零空间的维数 + A 的值域的维数. 

0.2.4 矩阵运算矩阵加法定义为两个间维阵列按对应元相加，并 a 用 + (“ AtIT ) 表示.它 
对应线性变换的加法（关于相同的％>• n 继承 r 从纯最域来的交换性和结 合性. 零矩阵 （所冇 
元全为0的矩阵）是矩阵加法的单位元，并且 A ^. n ( F ) 自身也是 F 上的向量空间.按通常方式 
定义的矩阵乘法用来表示 • 它与线性交换的复合相 对应. 这样，只有当 Ae / W _( F 〉， 



[ T ] M ,. V ( F ). R /> = "时. 它才有 定义： 它是结 合的. 一般是不交 换的. 例如， 

ri 0，| r l 21 「1 2"j「l 01 

Lo 2」U 4J^ L3 4JL0 2」’ 

但是.当把矩阵限制 ft M ,,( F ) 的某柊冇研究价偵的子 集时， 它可以是交换的.矩阵乘法有一个 
单位元 • 即形如 

「1 0 1 


! 0 1」 

的矩阵 leMJF ). 这个矩阵以及它的所有纯蚨倍数（称为 纯贵矩 阵）与 iVfJF ) 中的所有其他矩 
阵都可交換， 并&只 钉纯擀矩阵具有这一 性质. 矩阡乘法对于矩阵加法是分配的. 

这里需要指出 • 我们总是川符号0表不以下各种术 语： 芩纯姑、零向蟥（所有分 t 都等丁- 
零纯*的向《>和零矩阵（所有的元都等于零 纯#〉 . -般地 . _L F 文将明确它是哪种情形，因 
时不会引起混我(门还川符号/表小 Mf : 意阶数 的申位矩阵. 如果可能引起 混淆. 就指明其 
阶数. 

0.2.5 转置与 Hermite 伴随如* \ = M _( F ) , 的转 S , 记作 A 7 . 足 K .,„( F ) 中的 

一个矩阵，它的元是即将原矩阵行与列调换.反之亦然.例如， 



W . 然， /\6 Mw ( C ) 的 Hermilc 伴 M . V 定义为 /V = A r . 其中 A 表示按分锹取共 
轭. 例如. 

「⑷2-,丁 = 「1-,. -3| 

L 一 3 — 2 /」 L2 + / 2/」• 

转置和 Hermite 伴随[以及将在（0.5> 中讨论的矩阵的逆]都服从倒 序律: [ AB] B =«• A •和 

肖然要假定乘枳有 定义. 对于乘积的共轭，不存在 倒序： AB ^ AB . 如* a ., 
^ eM ,.,= C \ 那么•是纯并 ft 它的 Hermite 伴随与它的复共轭 相同； W 此，（: = 

〆 x = a ' y = y r j \ 

[XI 2. 6 矩阵乘法的技巧这里 • 给出几个要反 g 用到的矩阵乘法的 简申性 质. 

】•如果〜表示矩阵 B 的第） 列，那么乘积的第 y 列 正好是 

2. 如果 〃，表 示矩阵 A 的第/行.那么乘积的第，•行正好是 

解释一•下，在乘积中，左乘以 A 是乘 B 的列，而右乘以 B 是乘/\ 的行. 对其中 -- 个 
因子是对角矩阵的情形，在 （0.9. 1) 中再讨论. 

3. 如果•.”（&， . ft - reF , 那么 Ar 是（以 j •的坐标为系数的 M 的各列的线性组合. 

4 - 如果 AeiW _( F >. H .. y 6 F % 那么 yA 是 （ 以； v 的坐标为系数的) A 的各行的线性组合. 
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0.3 行列式 

只用一个数槪括-种多变 M 现象 • 这在数学中常常很有用.其中行列式就是一例.行列式 
只对方阵有定义，并社它可以按两种《要的，完全不同的等价方式来描述.我们把 
的行列式记作 det A . 

0.3.1 Laplace 展开对 A = M ,,( F ) 的行列式可归纳定义 如下. 假设行列式在, ( F ) 

I :已定义 • 设 ,( F > 表示从 AeMJh 中划去第，•行和第）列后得到的子矩阵.千足. 
对所有的/7<//. 

鳄 if 

2 ( ~ A " = D^^^det A„ . 

1 I 

而这个相同的值就是‘ 1 九等式左边是依第/行关于诸子式的 Laplace 展 开式. jfn •右边是依第 
J 列的 Laplace 展开式[见 （0.7 •丨 ）]• 对于任意选抒的行和列， K 中任一展开式 都徇到 A 的行列 
式.归纳过程从 1 X 1 矩阵开始，定义它的行列式为中•个元的值.于是 

detLcin J = c/n . 



等等. 敁然，如采 A 6 iVUC >, 则心 i/\ r = ckrt /\, H.det /\- = d ^ W \. 

0.3.2 交错和受上述低维例子的 发. 对 f A = O v ]€ A ^( F >. 还冇 

_ 

d e t/\ = y^sgn a [] a mtii . 

5 f « I 

it •中 • 求和取遍 U 2. •••• « 的所有个排列 ex , 排列 er 的“正负号”或“ 正负号 阑数” Sgnj ^ 
+丨或一 1. 取决于由{丨，2，…，开姶到得到排列 tr 所需对换 （ 或两两 交换） 的最小数是偶数 
还& 奇数.于是. 每个乘积 

都在行列式中 出现， 如果 a 楚偶排列，则在乘积前冠以+号 • 如果是奇排列，就冠以 一号. 

如果系数 sgn ( T 用某些其他的函数来代替 • 那么所谓的广义矩阵闲数就取代了 del A . -. 
个例子是 per A ， 称为 A 的积和式 （ permanent ). 其中 sgn a 被恒等于丨的函数所代替. 

0.3.3 初等变换 有•二•种简单的基本变换，人们常常可以利用这些变换把任-个矩阵化简成与 
该矩阵相抵的、唯一简单的形式（即标准形 >• 以便用它来解线性方程绗.计箅行列式，矩阵求 
逆和研究矩阵的秩，等等.我们集中讨论关于行的变换 • 它们是如下五种变换 • 

第 一种： 交换矩阵的两行 

交换第 i 行和第）行珂以经左乘以矩阵 



0 


i 行 


-0 - -.- /行 

參 

1 . 

i 列 /列 

来实现，其中 • 在 i , j 位 / 位晋 上的网个非对角元是1，而所有未注明的元都娃 o . 
第 二种： 用一个非零纯量乘某一行 
川•个纯 ftU 乘 A 的第/行可以经左乘以矩阵 


V 行 


I •列 

来实现，其中纯 Mr 出现在 /. /位罝. 

第 三种： 把某一行的纯量倍数加到另一行 
U ] •乘第/行加到第行相当于把 A 左乘以矩阵 


:/行 

，•列 

其中纯 M ( 出现在），/位 S . 注意，上述每个作初等变换的矩阵 • 止好是把相应的初等变换施 
于单位矩阵/的结果. 

第一种初等变换在行列式上的作用是将行列式乘以一 1:第一种变换的作用是将它乘以纯摄 r; 
第：种变换不改变行 列式. 由此可知，如果一个矩阵有一个零行，或有两行相关，或任意 々行相 
关，那么它的行列式为零.一个矩阵的行列式是零，当且仅当它的诸行的一个子集线性相关. 
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0. 3. 4行简化梯形阵 对每个在中存在一个标准形， A 的行简化梯形 
( RREF ). 它可以经（不唯一的）一系列初等变换得到.许多矩阵有相同的 KREF , 每个矩阵不 
管经一列什么样的初等变换而得到，它只有一个 RREF . RREF 的定 义是： 

( a ) 各非零行的第一个非零元是1: 

( b ) 具有上述萏元1的列的所有其他元都为零： 

( c ) 全由零元组成的行出现在矩阵的底部： 

( d ) 诸首元1位于从左到右的“阶梯型”之中，即下一行的首元丨必须出现在其上一行的旮 
元1的右边. 

例如， 

■0 1 - 1 0 0 2 ' 

0 0 0 1 0 7C 

0 0 0 0 1 4 

■0 0 0 0 0 0 . 

fiRREF . 的行列 式是非芩的， 当 fl 仅气它的 KKEF 足申位矩阵 
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0 


10 】」 

(它的行列式足 I ). 记氽 F 把 A 化成 KRKF 的每个初等变换对/\的行列式的 作用， P 〖以用来 
if% del A 的值. 

考虑线性方程绀 = 其中和已知，而 * r 6 F 未知.对/\和/;施以 
相同的初等变换，解染合不变.解珂以从 [> U ] 的 RRKF 呑 出来. 多实上， RKEFS •唯 一的. 
并 H 两个方程绀 = 足解等价的（有相同的解集合>. 3且仅当两个增广矩阵 [ A /;] 冇相同的 
RRKF . 

后向，将讨论 RRF 下在求矩阵的秩和逆中的作用. 


().3.5 乘法性质行列式函数最关键和最重要的性 质是. 它是可相 乘的： XM* A, /36M„(F), 

det AB = det A det B . 

HI 初等变换把 A 和 B 都行简化就可以证明这个等式. 

0. 3. 6 行列式的函数特征把行列式分别看成每一行（或列）的函数 • 而 ih 其余各行（或列）不 
变，那么它是该行（或列）&元的线性 函数. 从 UpUce 展开式来看 • 这是很明显的 • 因为一个 
给定的元的系数正好是它的土余戶式.而余子式是固定不 变的. 如果一个函数依次对其各变元 
的一个给定划分中的每一组变元都是线性的，就称这个函数是 多重线性的. 这是相当广泛的一 
类函数.例如，函数 /( A ， t 2 > = om 2 关干划分{々}，是多重线性的.又如，行列式作为 
矩阵的各元的函数，它对相应于各行（或 列） 的划分是多重线性的 .. 

人们自然要问，是否迄今所提到的行列式的任何一组性质都把它描述成的/个元 



H 


第 0 章 


[ID 的一个纯》值函数.行列式是唯-满足下列条件的闲数/: H ,( F )- f ： 

( a ) 多重线 性的： 

( b ) 交 错的： 第-种初等变换使结果乘以一 1: 

( c > 规 范的： /(/) = 1. K - 中 是申 位矩阵 • 

积和式函数（这是另一癸广义矩阵函数）也是多重线性的和规范的 • 但它不是交错的. 

0.4 秩 

矩阵 A 6 M ( F > 的秩是一个与它相关联的非负 幣数. 记作 rank . A . 

0.4.1 定义如果耶么 ， nmk / V 运八的列向中极人线性无艾绀的向 ft 个 
数. 这个列向世组4然不是唯 一的. 何这个集合的举数（元家 个数） 是唯一的.值得注意的是， 
rank A 7 -rank A . 因此，等价地，秩可以川线性无关行来定义.这通常简述为“行秩=列秩”. 

0. 4.2 秩与线性方程组线性方程 mA : r 二 W 0.3.4〉 坷能有0个、1个或无限多个解，但这些只 
足可能性.如果方程绀至少有一个解 • 我们就称它 M 相容的.线性方程 ms •相容的，^ H .(3( 41 1 
ran k [ A /，] = nmk A • mXU +丨） 矩阵 [^] 称 为增广 矩阵. 并 H . • 说 增广矩阵与系教矩阵 A 冇 
相同的秩就足说/;钻 A 的各列的线性绀合.这时 • 把 A 添加到 A 的列中不会增加秩.线性方 
稈组/\.7* =心的一个解是这样一个向该 _ r , 使得6是以其分1为系数的， A 的各列的线性组合. 

0.4.3 RKEF 和秩初等变换不改变矩阵 的秩. WfM , A 的秩与 A 的 KRKF 的秩相 M . 它恰好 
钻 RRKF 中非零行的 个数. 川 KREF 计裨秩受病态的 影响： 在中间的数值 i | W •中，命人误差 
可能使 KKEF 的零行出现非 芩元. W 而影响秩的识別. 

«• 4. 4秩的特征以下关于某个矩阵 A 6 M _( F > 的各个命题都坫相互等 价的； 每个命题可能 
1121 在不冋的上下文中用到. 

( a ) rank A — k ： 

(M A 有 々行 组成的一个线性无关组，而多于 A 行就线性 相关； 

< c ) A 有々 列组成的一个线性无关绀，而多于々列就线性 相关： 

( d > /\冇一个其行列式不 为零的 子矩阵 • ft ! A 的所有 U + l ) xa + i ) 子矩阵的行列 
式为0: 

( e ) A 的值域的维数是务： 

( f ) 有々个 ftl 乂 +多于々个线性无关向 S / T 组成的集合，使线性方程 mAr = A 是相 容的； 

( g ) k = „( A 的零空间的维数）. 

0. 4.5 关于秩的不等式涉及秩的不等式有以下几个. 

( a ) 对于 Ae ， rank A ^ min {/ w , w (. 

( b ) 从一个矩阵中划去若干行和（或）列后，所得到子矩阵的秩不大于原矩阵的秩. 

( c ) 如果 A 6 M ,”.*( F ) • M *.,( F ) % 那么 （rank A + rank B ) 一 A^rank AB<min{ rank A ， 

rank B ). 

< d ) 如果 A ， B 6 M _( F >， 那么 nmk(A + B)< ran k A + ran k /3. 稍微复杂一点的是 
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Fro ben ius 的一个不等式. 

( e ) 如果 /3 eM *. A ( F ), C 6 M P .,,( F ), 那么 

rank AB - f - rank HC ^ rank B 4 - rank ABC. 

由此可推出另一些不等式. 

0.4.6 关于秩的等式 

Ca ) 如果 A 6 A ^. JC ) ，那么 rank A ’ = rank A 7 = rank A = rank A . 

( b ) 如果和 CeM ,( F ) 是非奇异的， EBeACJF )， 那么 rank AB = ran k B = 
rank / JC=rank ABC； 即左乘或右乘以一个非奇异矩阵，其秩不变. 

( c ) 如果 A , 那么 ， rank A = rank B. 当 M 仅当存在非奇异矩阵 A ： € ( F ) 

和 y € R ( F ), 使得 

( d ) 如果/，那么 rank /\* A = rank A . 

( e ) 如*/ \ eM ,_( F ) 有秩 K 那么 

A = XBY, [ J 3 

it •中； V 6. UF ). 和是非奇 异的. 特别地，秩为1的矩阵 A 总可以写 

成形式 , jt •中 • rer ”， ： yer 是某两个向*. 

0.5 非奇异性 

如果一个线性变换或矩阵只对输人0才产生输出0,就称它是非奇 异的. 否则就称它是奇 
异的. 如果八6从_(10,且则 a - 定是奇 异的. 设/如果存在矩阵 
M "( F > (称为 A 的逆）使得就称 A 是可 逆的. 等价地，如果线性变换 A 足丨 -1 的， 

R 它的逆变换（它也是线性变换）存在，就称 A 是可 逆的. 如果且 A^A = / ，则 
AA'=1； 只要/存在，它就是唯一的. 

可用多种不同的方法来判别 A 6 MJF ) 是否非奇异，这是很有用的.如果/以 
下各命题 等价： 

( a ) A 是非奇异的 | 

( b ) A -’ 存在； 

( c ) rank A ==;/； 

( cl ) A 的各行线性无关 i 

( e ) A 的各列线性 无关； 

( f ) det A ^ O ： 

( g ) A 的值域的维数为 ; m 

( h ) A 的零空间的维数为 0; 

( i ) 对每个 /; er*，Ar = 6 是相容的； 

( j ) 如果九 r = 6 是相容的，那么解是唯 一的； 

( k ) 对每个 /， er , 九 r =/> 是唯一解； 

( l ) A.r = 0 的唯一解是 x = 0, 




( m ) 0 不是 A 的特征值（见第 1 $>. 

M ,,( F ) 中的非奇异矩阵构成一个群，称为一般线性群.常记作 GL ( W , F ). 


0.6 普通内积 

我们约定，把 F 的元累看作列向量[即 F "= M ，.,（!*')]• 于是，如果 . tGCT , 则/和 ，是 
行向：注意，如果了€«-，则 

0.6.1 定义纯 M . v ) 是 x 和: vGC * 的内枳（纯景积）.常常把它记作 b ， 还 uf 以 
定义不同于这个内积的各种内积，所以义把这个内积叫做向最空阆 C ” 上的普通内积或标准内 
CEJ 积.应该指出 <•• • >对第一个变元是线性的（<心+舡” PKA ， 7>+/?<1 2 , _ y > 对所有 a ， 
和 . r ,，々6 CT 成 立）， 而对第二个变元是共轭线性的（< 1 . a >+^ 2 >=«< r , 义> + 
/?〈，， . V 2 > 对所有 a , # 60 ：和夕,， 力 ec " 成立 >• 

0.6.2 正交性两个向研: yGC ” 称为正交， fi 指 j ->=0. 在二维和三维情形，通常把 
正交几何解释为垂盘.如*向 M 组 u ,, ^, …， .， dccr 中每两个向«都正交，躭称它为止 
交 m . 如果一个 it 交向馱组中没有一个是；向»,那么它一定线件 无关. 


0.6.3 Cauchy-Sdiwarz 不等式如果 t € C ", 非负纯量<■!•， 2 是 .r 的 Enclid 长度 . Enclid 长 
度为1的向量叫做正规化向量（或单位向 量）. 对于任意一•个非零向* * reC ”, x /{. r . 坫与 
• r 同向的正规化向 fi . «本的 Cauchy Schwarz 不等式是说， 

I <‘v ， .r> | ^ ? <.y^>' k， 

对所冇^ . y € C ” 成立：其中等号才成立.仅当 t 和: y 线性相关，推广正交概念， M 个作 
零向佾 . r ， y 6 C ” 之间的夹角可明确地由公式 


cosO = 


(x*x) 


•J> I 
2 <* y ，* y > 




来定义. 


0. 6. 4 Gram-Schmidt 标准正交化 •个线性无关向 ft 绀 （ 它绀成它的张成空间的-•个榷）可以 

—空间的一个 标准正 交 （ 两两正交的 • 各 [1 正规化的）堪来代替. fl ： 观 h #, 这可能起合理 
的. M 然这种荇代原则上可以用无穷多祌方式来实现，但足 • 作进行这种锌代时•有-种祁常 
简便的、行之符效的许法.称之为 Gram Schmidt (标准正 交化） 过程， 设 a ，…，是一个« 
向 M 空问的”个线性无关问《：的集合 • U , ，… • ： rd 是要确定的 正规化 向母的正交组 . 可以依 
次如 f 计算 Z ,. 设力=.0,并取 



<vi -.Vi ) 1 ? . 

JH 使得 A 是正规 化的.设又， 2 l > c ,. 使得： V， ： 与 ！：， 正交，然后取 



<.V2 * V 2 >' ： 


使得 Q 是正规化的且与正交.类似地 • 将上述过程继续下去.假设…， Ay 已被 
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确定，设 

,2*-| >2*--) — <a* t2*- 2 >Z *_.2 —… 一 <jr i9 z, >Zi , 

使得: y * 与〜，…， a -, 正交.然后正规化％便得到 

^ = <_'， 二 > ,2 . 

继续做下*.直到得到所要求的标准正交向 W …，％.注意，利用上述方法，一个无限的 
标准 IF . 交组能够由无限维向 fi 空间中的一个无限可数线性无关组得到. 

在 Gram - Schmidt 过程的每一步中，标准正交向贵 a ,…， A 仅仅是原无关向请心，…， 
A 的线件组合（反之亦 然）. 如果和 X = [ u 2 ." i ,] 分别为以向堵： r , 和 . r , 为 
列的矩阵，那么 K •中，矩阵 / e =[ r v ] 是非奇异上三角矩阵：即，与 />) 时， r ,=0. 

烺后， 我们指出， Gram - Schmidt 过程耐以应 用丁任 一妨限 的或巧 数的向费序列—定是 
线忭无关的）.如果该集合不线性无关，那么 • 对于使 U ,, …，为线性相关组的最小 々值， 
将得到向贵： y *= 0 . 这时，是 t ,, …， x *-, 的线性组合.用代替： r *, 并继续 Gram - 
Schmith 过程便可冋答这样一个 问题： 什么是 {. r , •…， 的张成空间的基或维数？ 

0.6.5 标准正交基一个标准正交向》组就是这样的正交向》组，它的第一个向罱都是正规化 
的. 这个向不可能包含向 *0, 并 a —定线件 无关. 一个标准 FR 交*是由标准正交向成 
的银.闪为任-个* 可（经 Gnim - Schmidt 〉 化成标准正 交基， 所以，任一有限维 复向疳 节问有一个 
标准正 交苺. 因 为在汁 算内积时，交叉项部变 为零. 所以与这样的《打交道是很合意的. 

0. 6. 6正交补给定任意子 * S (= C ”， S 的正交补是集合 

ue cr*^：y = 0,对所 w：y S }. 

即使 S ’ 不是子 空间，义也总是子 空间. 我们有 （Si )- =Span S ， 并且，当 s 是子空间时， 
( S :) J = S . 这时 ， dim y + dimO ) 丄 = W . 在关于线性方程绀九 r = A 的叙述中（其中 Ae 
应注意的是， A 的值域正好是 A •的零空间的正 交补. 即 A*r = A 冇解（不必唯一>，4 
a 仅当 ^= o 对所有使 a - z = o 的 zec m 成立 • 

0.7 分块矩阵 


类似于集合的划分 • 一个矩阵的分块是把该矩阵完全地分成一些互不相交的子矩阵，使得 
原矩阵的每一个元落到 R 只落到一个分块子矩 阵中. 为 i 只别些有用的结构，矩阵分块往往是 
—个方便的方法. 


0.7.1 子矩阵设对于指标集 aG { l ， …， m } 和 
标号 a 的诸行和标号为沒的诸列的（子）矩阵 i 己作 A( a . #). 例如 



3* 

6 ({1,3>,{1,2,3})= 
9. 



3_ 
9- 


W ， 把 A 中位于 


ill * /// = // = 子矩阵 A ( a ， a ) 称为 A 的主子矩阵，简记为 A ( a >. 说明一个子矩阵或一 

个主子矩阵是经划去那些行或列得来的，常常要比说它们包括那些行或列要方便些.这可以通 



过补充指标集来完成.例如， A ( a , 〆 ）是划去标号为 a 的诸行与标号为0的诸列后的 结果. 

矩阵 A 的子方阵的行列式称为 A 的一个子式. 如果子矩阵是一个主子矩阵 • 那么其子式 
称为主 子式. 那些出现在 Uplace 展开式 (0.3. 1 ) 中的带 正负号 的子式 [(一 1广 Met A ,;] 称为 A 
的 代数余子式. 约定，空主子式是1， 即 detA (» = l . 

0.7.2 分块与乘法如果 ai •…， a , 组成1，…，的一个划分，而庠，…，沒 、组成 {1，…， 
W 的一个划分，那么诸矩阵 A ( a .， ft ), 构成的一个分块.如 

果和 BeiVC / F ) 已经分块，且使 {1, …，的两个划分重合，那么就说这两个矩 
阵分块是共形的.这时， 

s 

川爲， y ,)， 

*-| 

其中 AG ,， 爲）和 B (戽， 是 A 和《的共形 分块. 等式左边是，乘积 Aii 的一个子矩阵（按通 
常方式计算） • 而右边的每一个被加项是一个标准的矩阵乘积.因此，共形的分块矩阵的乘法 
与通常的矩阵乘法相仿.当各被加项有相同的分块时.分块矩阵的加法也是有意义的. 


0.7.3 分块矩阵的逆求出非奇异分块矩阵 A 的逆的相应子块，即用相应的分块形式给出分 
块矩阵的逆 • 有时很 有用. 可以采用各种不同的，但彼此等价的方式来求分块矩阵的逆一-假 
定的某些子矩阵及 A *" 1 也是非奇异的.为简申起见，设 A 是如下的分块 

A = r An A ,2 i . 

-An A22 -J 

K •中， A „6 M „ ( F ), /=1. 2 R ; i ,^/ i 2 = w . 关于 / T 1 的相应分块形式有一个有用的表示式 

C^ll _ ^12^22 ^21 1 ^lV A |； [iA 2 | An* /\i2 一 1 "I 

-LA21 An A12 一 Ai2 ] ' A 2 | An [.A22 — All* A\2 ] 1 」 

其中 • 假定所有有关的逆 存在.或者， 用一般的指标集记号，可以 id 

A 1 (a) = [A(a) A(a«a )A(o ) 'A(a ,ff)] 1 , 

以及 

A 1 (a»a ) = A(a) l A(a*a )[A(a *a)A(a) 'A(a.o ， ) 一 A(a )] ! * 

仍假定有关的逆 存在. 还可以写出其余的表 示式. 注意 ， A Ucx ) 是 A 1 的子矩阵， ifiiA ( o )^ 
足 A 的一个子矩阵的逆，并且这两个矩阵一般不相同. 


0.7.4 小秩修正矩阵的逆 如果已知某个矩阵 的逆. 了解该矩阵 W 加上一个“小”秩矩阵时，其 
逆如何 变化， 这同样是一个有意义的 问题. 有这样的简便公式，只要修正矩阵的形式足够简 
筚，就可以使新逆的汁算比从头开始汁算要简便.设非奇异矩阵的逆 A — 1 已知， 
考虎 

B = A + XRY, 

其中， 矩阵，而尺是 rXr 非奇异 矩阵. 如果朽是非奇异的，耶么 

b [ = -a 1 X(R 1 +yA-X)- , yA- ! . 

如果 r 比”小得多，那么求尺和 k — •的逆坷能要比求 b 的逆更为容易，并 a , 如果 


a 是容易求逆的，旦有使乘法简化的形式.那么，采用这个公式可能要胜过 e 接求 k 的逆. 
例如，如果修正矩阵有秩1, X 是” X 丨的， V "是1乂”的， M 尺=[1]，上述公式就变成 


13 〜七 n^W v,xyA_ ' 

(注意，此时 AT=B — 特別地，如果 

B = / + _ o， r 

对于』•， yeF \ /6 M „( F ) 成立，那么，只要 yj •关一1，就有 



1 + y -T 


0.8 行列式（续) 


关十行列式的一些补充材料和恒等式对于某畔论®的阐述很有用.其中大部分内容 在苺础 
线性代数中+易找到. 


0.8 •丨复合矩阵 设矩阵 _ ( F ). 其某个阶数的所有子式组成的阵列称为/ \ 的复合姐 

阵. 特別地，它的… P 元为 del AU . /?) 的矩阵叫做 A 的第々次复合矩阵， i 己作 

Ck ( A ). 这里， aCU •…, m > 和 / JSU • ii > 都是基数为 it < fni n {/ W ， 的指标集,按通 
常的辞典式次庁•排列 • 即丨丨，2, 4>排作丨丨 • 2, 5} 之前，{】，2, 5} 排在（】，3, 4丨之前••等 
等. 例如 • 如采 


则 



' 

1 2 


1 3 

I 

2 3 


(let 

4 5 

det 

_4 6. 

det ； 

‘5 6_ 
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若 A 6 从是非奇异的，则 CJAK 1 = C k (A~ l ). 
若 A e M_(F), 则 C*(A r ) = C*(A) r . 

若 AGA^./C〉， 则 C'(A-> = C*(AV. 


0. 8.2 经典伴随和逆如果 AGMJF)， 由诸代数余子式 

b v = (- lWdet 

组成的转置矩阵称为 A 的（经典 》 伴随，常记作 adjA. 冇时川转置伴随来代 
替伴随，以免与 Hermite 伴随 A •相 混淆. 注意， 

adj A = EC^,(A) T £°, 


K 中 


E = 


用 Uplace 展开式计算行列式的公式说明， 

(adj A)A = A (adj A) = (dot A)l. 

因而,如果 A 是非奇异的 （det A 关 0> ，那么 

A' 1 = j-^-radj A. 
det A J 

一般说来，用伴随来数值计算矩阵的逆不是可取的方法，似是伴随对于给出逆的解析表达忒是 
有用的. 


G 原书给出的这个关 系式是 错误的（但书中尚未用到这个关系式 ）• adjA3(\ ,(A> 应足如下 关系: 

ftHj A = J 0 C\ ,(A) T y. - (A) T 7„ (n 为俱败 > 

adj A = JoC^tCA) 1 J o = J i U 为奇数). 

K 中 n 阶方阵和 7, 分 别为： 



详见 引文： 杜忠复等.复合矩阵与伴随矩阵的文系及哎用.丁科 数学. 1999. G, 156-158.-- 一 译者注 


0.8.3 Cramer 法则当非奇汙时， Cramer 法则是求线性方程组 A*r = 6 唯一解的一种 
方法.它和逆的伴随表示有相同的计算手续，一般，只有在需要解析地给出解向《：的个别解析分 
谢时，这种方法才 有用. 如果 J •，是解向璜的第/个分 M ：， 那么， Cramer 法则可述为公式 

det (.4 b) 

X, = dTTA~~• 

id 号 A — A 表示中第 / 列是/;， X : 余各列与 A 的对应列相同的矩阵. Cramer 法则可直接由行 

I 

列式的乘法性质推出.把方程组 . A.r = A 改写成 

* A U *- r ) = A — 厶， 

9 I 

然后两边取行列式（利用乘法 性质） 可得 

(del A)det ( I j ) = det (A b ). 

f 9 

Iflldet ( 1 - a ) =. r ,, Wlfjj 公式得证. 

I 

0.8.4 逆的子式推广非奇异矩阵的逆的伴随公式，有如 F 重要公式： 

del A - X ( a ^) = (- 1 >(,?:'?;〉, 

det A 

它把 A '的 iff 子式与的诸子式联系起来.对于主子阵.这个公式有简羊的形式 

dcl = 

det A 

0. 8. 5 Schur 补和行列式公式对 r •绐定的矩阵 A 6 M n ( IO , 设^€<1,…， 娃使 A ( a ) ||:奇异 
的指标 集. iiZA («> 的逆力人用 0 和 (/对 A 作 2 X 2 分块，据此，关于 det 的藥要 公式是 

del A = det A ( o ) det [/ l ( a ， ) _ /\(Q « a ) A ( o ) 1 / A ( a»a )]. 

注想 • 这个公式相:广 r (0.3. 丨〉中的关 f 2 X 2 矩阵行列式的苒通公式.称特殊矩阵 

A(a ) — A(a . a ) A ( a ) 1 A ( a * a ') 

为 A 的 Schur 补•将 



然后把/\ :1 和 / U a ) 等问起来，就可验和 Schur 补公式成立.注意， Schur 补已在的 
分块中出现过[见 (0. 7.3)]. 

0.8.6 Sylvester 恒等式 设•…， W 是间定的指标集，设 ii = [心]6 M „_*( F ) 由 

b„ = det A(a U U (>}) 

所定义，其中々是 a 的基数 ，/• )€ U , …， W 是不包含在 a 中的指标， A 6 M ,( F ). 另一个 
有用的行列式恒等式是 

det B = [det A(a)]*~^ 1 del A 

0.8.7 Cauchy-Binet 公式 这个有用的公式是可以想起来的，这是因为它看上去与矩阵的乘法公 
式相 类似. 它等价复合矩阵的乘法性质（见0.8.1)，所以这不是偶然的 巧合. 设 AeM ,^( F )， 
和 r =/\ B . 再设 l < r < min { w ，务 • w } ， a ^{ l ， …， 和卢 G { i ， …， r /} 都是基 
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数为/ •的指标集.关于 C 的 a , #子式的表示式是 

det C(a*p) = ^ det A(a,y)det . 

其中和式取遍基数为 r 的所有指标集 yG < l , …， 

W .8.8 子式间的关系 已知 A € M _( F ), 给定基数为々的阂定指标集 a g { l , …•川丨，当 
cv^iU W 取遍 基数为々的有序指标 集时， 滿子式 

det A(q,w) 

不是代数无关的， W 为在各子矩阵中诸子式多 fiS ? 矩阵中的各4、•相同的元.在这些子式当 
MJ 中，二次关系是知道 的. 设/•， I :•…， i \ en . ，/>足个互异的指标，不一定取自然顺 
序，乂设 

A(a:/'i * ••• */*) 

表示这样一个矩阵，它的各行川 a 标号，而它的第）列是 AU , {】• •••• 的列.这与前 
述 ill 号的差 別是， 列可以不按 ft 然晰序，如在 A (<1, 3}; 4, 2) 中，它的第丨列有 A 中的1, 
4元和3, 4 元. 于娃有关系式 

det A(a »/ 1，“ ， ，“ )de! A(aiJ, ••- f j k ) 


= 2^ Aiaiii "•，“•，，I •…， /*)dei Aiaiji •… ， _/V.. i, * j ,,, ,••• f j 

它对于每个.、=丨，…，々和 A 译指标的所有序列 

… C 1 U ••••，，/}和 ）i •••••)* € U 

成立. 


0.9 矩阵的特殊形式 

经常会遇到某畔特沭丈的矩阵，这畔矩阵具有特殊的 性®.为了参 阅.其中有些矩阵俏 
得在这里介绍,并给出其名称. 

0.9.1 对角矩阵如果矩阵 D = 在）关，•时 • 有乂,=0,就称 D 为对角矩阵.平常， 

把这个矩 阵记作 /^ diagW ,, ，…， c/„^D = di ag 丄其中 c / 是 D 的对角元组成的向掛 • 如 
果•个对角矩阵的所有对角元邰是正（非负）实数 • 就称它为止 :（ 非负）对角矩阵.注意，术语正 
对角矩阵指的矩阵是对角 形的.卩 1有正对 角元； 它不坫指那种所有对角元碰巧都是正数的 
一般矩阵.单位矩阵是正对角矩阵的一个例 P . 如果对角矩阵 D 的诸对角元都相等 • 就称 D 
为纯量 矩阵； 即对某有—个矩阵左乘或右乘以 -- 个纯揪 矩阵，与川相应的纯 M 
乘这个矩阵的作用相同. 

— 个对角矩阵的行列式正好是它的诸对角元之 乘积： det Z) = \\ j „ . 因而， •- 个对角矩 

阵是非奇异的，当且仅当它的所有对角元是非零的. ACM” 左乘以对 1 角阵 D , 即/^就是用 
/) 的诸对角元乘 A 的各行（/\的第/行乘以以„. / =1. 2.；；). 而右乘以 D , 即就是 
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用 D 的诸对角元乘 A 的各列.因此，所有对角矩阵关于乘法相互交换，并且，一个对角矩阵 [23] 
与某个矩阵珂交换，当且仅当在 D 的第/个对角元与第）个对角元不相同时， 

有& =0. 两个对角矩阵的乘积也是对角矩阵 • 其对角元正好是它们相应的对角元的两两乘 
积.类 似地， 可以规定一个对角矩阵的正整 数幂. 

0.9.2 分块对角矩阵 具有形式 

A ,, 0 

a = • 

0 

的矩阵称为分块对角矩阵，其中， A b 6 M m , ,= 1，2,…， / r 且 = n . 形式上， 

i « I 

这个矩阵常常用 A = y \,, ㊉ / ㊉…㊉ A “来表示，或简记作 ㊉ 称这个矩阵为 A ,,， 

i» I 

々”••••• A “的 直和. 从分块矩阵的乘法来考虑，分块对角矩阵的许多性质推广了对角矩阵的 

* k 

性质，例如， d e t ( ㊉ n det - 因而， a =© s ' 是非奇异的，当 a * 仅$每个人是 

…丨 —I 

非奇异的，/=1，2•…， / r . 另外，迕和/，与/3=@&氏可交换，其屮 A „, 坆是间 
阶的.当且仅当 A ■与 ii ■可交换，1=1, 2, .... k . 还有， rank (㊉ ^>.)= rank A .. 

i-l i-l 

o .9.3 三 角矩阵 如果矩阵当 7 </时，有 ~= o , 就称 :r 为上三角矩阵.如果 
/ 7 = o , 就称丁是严格上角矩阵，类似地，了称为下三兩（或严格下三) «) 矩阵•是 
指它的转 迓是上 '角（或严格 h 三角）矩阵.与对角矩阵类似，三角矩阵的行列式是它的诸对角 
元之 乘积.三 角矩阵（两种中的任一种）不一定与另一 种三角 矩阵町交换. AeAl 左乘以下三 
角矩阵即就是用 L 的第1行至第 I 行的线性组合代替 A 的第/ 行. ft 述及三角矩阵 
时，有时采用术语右（代 替上〉 和左（代 替下） 三角 矩阵. 三解矩阵的秩至少是（也可能大丁)主对 
角线上非零元的个数. [2 T ] 

0.9.4 分块三角矩阵 具有形状 



k 

的矩阵称为分块上三角 矩阵. 其中 A . e / W ，， 1 = 1， •••• k , ••表示任 

I 

意 块元. 分块下三角矩阵，严格分块下三角矩阵和严格分块上三角好阵都可以类似地定义.分 
块4角矩阵的行列式是诸对角子块的行列式 之积. 分块7角矩阵的秩至少是（也 nf 能太于）诸对 
角子块的秩之和. 
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0.9.5 置 换矩阵如果矩阵在它的每一行和每一列正好有一个元等于 1， 而其余所有的 
元都是0,就称 P 为置换矩阵. 乘以这样一个矩阵的效果是使被乘矩阵的行或列 互换. 例如 


是 ff 换矩阵，而 


0 1 0 ' 

P = 1 0 0 6 M 3 

.0 0 1 



是向的行（分的互换，即它把第一项换到第2个位肾，把第2项换到第1个位置，而 


il : 第3项保持在第3个位置.一般地，矩阵左乘以筲换矩阵/就是互换 A 的行， 
Ifij 矩阵/右乘以 S 换矩阵就是互换 A 的列.实施 (0.3.3) 的第一种初等变换的矩 
阵是一个特殊形式的 S 换矩阵，称之为对換姐阵. 


置换矩阵的行列式是土 1[在 （0.3. 2) 的公式中正好有一个被加项非零]，因而置换矩阵一定 
是非夺 诗的.虽然 B 换矩阵关于乘法一般 M 不交换的，似两个 SS 换矩阵的乘枳还是一个？ f 换矩 
阵.囚为申.位矩阵是一个置换矩阵，并 R 对每个 S 换冇 = 所以， S 换矩阵构成 
中的非奇异矩阵群 c > 的一个 f 群，它具冇有限基数 n !. ' K 实上，任一笟换矩阵是 
一些对换矩阵的乘积. 

因为， 如果置 换矩阵以某种方式互 换行， 则 1 就以同一方式互换列，所以， 
变换以相问的方式互换 A 6 M ， 的行和列，这个变换相当于1排诸元的足码.如果 
矩阵有某个置换矩阵 P 使得 R/U 〃是 三角矩阵，就称 A 为本 性三角 矩阵.这些矩阵勺 
三角矩阵有许多共同之处. 


0.9.6 轮换矩阵具冇形状 



的矩阵称 为轮换 掩阵. 每一 行正好是前一行循环一步，使得每一行各元刚好是前一行的各元的 
一个循环排列.置换矩阵 

■0 1 0 … 0 1 
0 


0 

1 0 
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称为 基本轮换转置矩阵 . 矩阵可以写成形式 

IT 1 

A = 

i-0 

当且仅气 A 是轮换 矩阵. 这里而系数 ，…， a 正好是 A 的第 1 行的诸元. 

W 为这个表达式，轮换矩阵具有与 r 相关联的优美结构.乂因为 C " = /， 所以两个轮换矩阵的 
乘积还是一个轮换矩阵.另外 • 轮换矩阵在乘法下交换.轮换矩阵有几种推广，例如其中之一 [26] 
是，把各行向前（或向右）循环一个大于1的固定步数. 

0. 9.7 ToepHtz 矩阵具有形状 



的矩阵 A = [… 称为 Tcepliu 矩阵. 对于某个洽定的序列“ “ 

…•心 ^6 C , -投项沿杜平：7 f 主对角线的诸对角线从上到下， A 的 
各元取 常值. Toephtz 矩阵 


0 1 0 

參 

參 


•0 

1 

• 

0 

• 

B= •••••• 

\ 1 

和 F = 


• 

• 

• • 

• 參 

• • 

• 


- o o. 


- 0 

• 

• 

1 

0_ 


称为“后向位移”矩阵和“前向位移”矩阵，这是因它们在标准基 Q ,, c …,^，丨的诸元上的 
作用而 得名. 矩阵♦，珂以写成形式 

A = 

% k^l 

当且仅当 A 是 Toeplitz 矩阵.在涉及三角矩的问 埋中, 自然 要遇到 Toplitz 矩阵. 


0. 9.8 Hankel 矩阵具有形状 



的矩阵 46/^*, 称为 ffankel 好阵.对于某个给定的序列〜…，七， 




d ,- 2 . 沿着与主对角线垂直的诸对角线， A 的各元取常值.在涉及幂矩的问题中，自然 
要遇到 Hankel 矩阵.注意，如果 

0 

P = 

; 0 J 

称之为“后向单位” ( 置换）矩阵，那么，对任意 Toeplitz 矩阵： T , 尸 T 是 Hankel 矩阵，而对于 
任意 Hankel 矩阵是 Toeplitz 矩阵. 因为， = P 1 和 Hankel 矩阵是对称的，这 
表明任一 Toeplitz 矩阵是两个对称矩阵 （ P 和 Hanke ! 矩阵） 的乘积. 



«. 9.9 Hessenberg 矩阵如果矩阵 A = [ ci y ]€ A 九对干! >) + 1 有〜= 


A = 


0 a s2 


L 0 0 —0 a MtW -，- £!••」 

就称 A 呈上 Hessenberg 形状，或称 .4 是上 Hessen berg 矩阵. 如果 A r 是上 Hessenberg 矩阵, 
就称为下 Hessenberg 矩阵. 

0.9.10 三对角矩阵如果珩阵 A = U ,,] eM w 既是 J ：, 乂是下 Hessenberg 矩阵 • 就称之为二二 
对角珩阵•即， A 是三对角矩阵 • 是指当丨/一） 丨〉1 时， a it =0： 

r«n 0 1 


a = 


Uii a 23 
^33 


W 用 a 纳法容易计算子对角矩阵的行列式•注意 

det A(U ， 2, … ，々 + 1” 


A ( {1 •…，々 一1}) 
k = 2 9 …， n—\. 


0.9.1】 矩阵和 Lagrange 插值法 Vandermonde 矩阵 A 6 M „( F ) 是具有形状 

1 x , x \ xi — xT 1 ' 

A = 1 J* 2 j! d … 


-J*- Jrl 


(0. 9. 11. 1) 




的矩阵，其中乃，1 2 ,…， j - a ^¥； 即八=[心]，其中〜=太乂 T 述等式成立 


det .A = J [ ( j -. - . r ,) , (0.9.11.2〉 

“ 广 1 

»>> 

于是，一个 Vandermonde 矩阵是非奇异的，当 R 仅当《个参数 > r , ， * r 2 ，… . 是互异的. 

Vandermonde 矩阵出现在插值问题中，所谓插值 问题. 就是求系数在 F 中的、次数至多 
为/广1的多项式 2 十…十使得 

p(.rj ) = a , UiJ't U 2 X \ +•••+“” 丨 iT 1 = * 

/>(- r - >=“.，+ a { x > 4 u：sj + ••• -f a „^ X2 1 = v ：» 

(0. 9. 11. 3) 

: : :: 

• • •雜 

/ >(j w ) = <i„ I til 4 a z x : n H - , J ： 1 = 

风:中 . r ,, 々••••• 凡和），，. . v 2 , •••• %是中 F 的已知 元索. 插偯条件 （0.9. 1】. 3) 是关于 n 个 
未知系数，的"个方程的组 •）1 ••且它们有 形式/ ^ = _ v , «.“ = [〜，“，，•••， 

( “ I ] f €■ F M . v -[ v , . y 2 . v „] ? € P . R A 6 Vandermonde 矩两 •（0. 9. 11. 1 >• 如 

果点 A，m ”•• 心各不相同， 这个插值问题总有一个解， W 为这时 .4 是非夺异矩阵 • 

如果点心 • …， A 是互 异的. 插值多项式的系数原则上可以通过解方程组 
(0.9. 11. 3> 求得.但诘 • 用特殊的 Lagrange 插值多項式 [29] 

IV 

11 (n,) 

L,(J> •-= ^ - • I = 1.2,-,w 

/• I 

表示插值多项式 p ( j > 通常更为有效.每个多项式 M』） 为，I 一 1次.且具有性质:如果々乒/, 
/.(^)-0；而 W 此，对 f 满足方程组 （0.9.11.3) 的、次数不超过 《—1 的多项式 
pis ) f 有 Lagrange 插值公式 

p ( j -) = >*i I . i ( j -) L 力夂， （J ) 4 ■… + y M L N ( x ). (0. 9. 11.4) 

0.10 基的变换 

设V是域 F 上的《维向错空间，^ = {1；,，巧，…， zU 是V 的一个基.如果是任一 
给定的向 W，W 为集合4张成 v \ 则^有某个表示式』 = a | V | + a 2 i ； 2 + …如果在同一 
个基下存在另一个表达式 +/^ v 2 +…+氏 v_ • 那么， 

0 = J ： — x = (ai — /?, )v\ - l (or 一 pz、Vz + … 十 （ a” 一 P„ 、 v„ 

由基禾 无关可知所有& 一汉 =0. 给定基从 V到 F 的线性映射 

ai 
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是意义明确的、一对一的和到上的.纯齡 a 称为 J •关于基扁的坐标，而列向量 [* r ], 是 x 的 
唯一冰坐标表示. 

设 v 是给定的线性 变换. 只要知道》个向 STv,， Tv ” …， Tv n , : r 对任一 了云 
V 的作用就被确 定了； 这是因为任一 有唯一表示1=^1，,+…+〜％，且由线性性质可 

知， T(atVi +••• raj”） = T(ai V| > +…+ Kd"% )=ff| Tv, + … +A7V,. 因此，一旦知道 
[r' ，就可以确定7> 的值. 

= U ，: •…， UU 是 V 的另一个基，可能与•為不同，并且假定了％的為坐标表 

示是 



耶么，对任一有 


[7>], 2 = [ Va ； r v> ] 4 _ - y^a.LTvJ^ 




hi 


「/ 


• 參 

I 


Qi 


kJ u - 

” X " 阵列 I / v ] 依赖于 T 和丛』 ，和禹的选抒，但不取决于 . r , 我们定义 T 的為-為基表示为 

^11 … tnl 


PL , 


= r . ( 了 W “. l _ ri，u 


已经证明，对任一 [7>]^=,:[ r ],,[>] •，实 际匕，为了绐出7.的一个基表示， 

的情形是 M 常见的《 aCT ],, 称为了的為基 表示. 

考虑甲.位线性变换/: V - V , 它定义为对所有 h Ix ^ x . 于 M . 对所有 x € V ， 有 
[iL， = C/r]. ; = [/-r],,=〜[/],，，■[/]〜[>]," 

依次取/ =议，,， xt ’ 2 ， … ，叫 • 这个悄等式能计算出，: [/ l ,，，[/] 〜的每•列，因而证明了 


=戽 


an -, = 


0 


0 


我们泛泛采用 同一个 记号/表示申位矩阵和申•位线性变换. 
始作同样的计算，也会得出 

- J /]- = / 


如果从 [: r ],, =[/. r ], =…开 
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因此，矩阵5[/]+是矩阵，[/]々的逆矩阵.如果记那么于是，形 
如 &[/],, 的每一个矩阵都是可 逆的. 反过来每一个可逆矩阵对某个基3 
有形式 t[/；U 可以把勿看成是用 [\： U , =\，1 = 1, 2,…，” 定义的向量组 &， i 2 , …， . U . 
因为 S 可逆，所以 向嫒组 3无关. 

注意到 

于是，~[/],,用基為表示基沭的各个 元素. 现在经计算 

[了:]失= l /( Tj )] j： = [7>] j , 

= •:!_/]•: ..[Tj^Cx]^ = i? [ 7] J( ^[TLJ/x]^ 

= 々[/]*， j , C ^]<, »,[/]、• 

依次取 • r ; = u，i • 斯，…，叫，便得出 

* 2 [ 了 ]— = «, L^Jj, 4, [T'Di, J, [Ojl；- 

这个 te : 等式说明，如果用来汁算表示的基发生变化， t 的基表示将如何变化.由于这个缘故， 
才称矩阵 L / ] ,,为基3 - 為的变換矩阵. 

任一 矩阵 AeM “ F ) 是某个线性变换 T : V — V 的一个基表示，这是 w 为，如果 M 是 V 的 
任一基，可以用[7>],=八[>],来 确定: Tr . 不难算出，对这个 T , ,[ T ], = A . 
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1.0 导引 


在本章以及后面各章中，先引人该章要讨论的主要问题，并用例子说明它们是如何从理论 
上或应用中产生的. 

1 . 0.1 基变换和相似性每个可逆矩阵是基变换矩阵，而每个基变换矩阵是可逆矩阵[见 
(0. 〗0)节].因此，如果义是向 M 空间 V 的一个给定的基， T 是 V 的一个给定的线性变换，且 
是了的 m 基表示，那么 • r 的所有可能基表示的集合是 

.[ T ]. ，[/ L , : ^ 是 V 的基 } 

= { s-'as * se m „( f > 是可逆矩阵 >• 

这正是与给定的矩阵 A 相似的所有矩阵的 集合. 因此，相似的，而不是恒等的诸矩阵正好是 
同一个线性变换的不同的基表示. 

人们自然希望相似的矩阵会有许多共同的性质——至少是基于线性变换的那些间有性 
质——这是线性代数的*要论题.-个矩阵只是某个线性变换的所有可能表示中的一个•从 
关于一个矩阵的问题去探讨关于该线性变换某些尚有性质的问题，这样处理问®往往很 
见效. 

相似概念是本章的主要槪念. 

1.0.2 约束极值和特征值本章第二个主要槪念是特征向 M 和特征值的概念.我们将看到，使 
Ax S - x 的一个倍数的非零向 fti 在研究一般矩阵或线性变换的结构中起着亟要的作用，而这 
样的向《出现在求具有一个几何约束条件的实对称二次型的极大值（或极小值）的基本问题 
中 ，即： 

假定 R \ x t t = 1,求， At 的极大值， 

其中 A r = A6iVt(R) 是给 定的. 这样一个约束 ft 优问题的传统研究引出了 Lagrauge 函数 L = 
x T Ax - Xx T x . 丁是， 它有一个极值的必要条件是 

0 = VL = 2(Ar = 0. 

因此，如果满足= 1的向景（因而 x 卢 0) 是 x T Ar 的一个极值点，它必定满足方程 
Aj : = Ax . 因而 A.r 是 x 的倍数.这一对 A，x 称为一个特征值、特征向量偶. 

习题 

1. 解释 （1.0.2) 中的约束极值问题为什么一定有一个解 • 并证明每个实对称矩阵至少有一 
个实特征值. 提示： 应用 Weierstrass 定理（附录 E ) 于连续函数 /( x )=/ Ar . 

2. 设 A 6 M „( R ) 是实对称矩阵 (/ V 『 = A ). 证明，在： r T x = l 的条件下，： T Ar 的极大值问 
题的解是 A 的最大特征值. 
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第 J 章 


1. 1特征值-特征向 量方程 

1.1.1 记号我们用 M ( F ) 表示域 F 上的 nXn 矩阵，通常 F 取实数域 R 或复数域 C . 所讨论 
的问题几乎常常是一些适合于复数矩阵的情形，这时 MJC 〉 简记作 M „. 对干复数矩阵的一般 
性质不感兴趣的读者，无论用实数代替复数来阐述什么内容，都很少在表述中，在代数中或在 
「341 实际中做出本质区別.但是应注意，常常在讨论多项式的根和其他与“较大”的复数域有关的灵 
活性问题时， R 与 C 之间存在着较大的差別.通常，最好把实数矩阵#成具有特定元的复数矩 
阵.我们知道，有〃个实分 M (相应地，复分 ft ) 的所有向量组成的集合（向 M 空间）用(相应 
地 c ”） 表示，并且都把它们宥作列向 M . «后， a =[ 心;] eM n ( F ) 的转罝 （0.2. 5>是矩阵 

H . ( F ), 记作 A T , 而当 FeC 时 ， Hermite 伴随是 A 的共轭转置 [ J „], 记作 . 类似地，如 
果 aer , 则表示与 X 有相同分撖的行向量，而当 FGC 时， ，表 示其分量为的相应分 
敏取复共轭后的行向讀.这里，“ •”上加一杠了表示一个复纯 M 的复共轭（见附录 A ), 或者表 
示一个向*或矩阵按分墩取复共轭. 

矩阵 Ae . M n 可 行作从 C " 到 （ T 的线性变换（对于<：”的某个给定的基），不过把它看作数的 
一个阵列也是有 用的. A 的这两个槪念是相互影响的，数的阵列能告诉有关线件变换的倍息， 
而这正是矩阵理论的实质和应用的关键.或许，矩阵理论中最重要的槪念应该是与 A 相关联 
的”个数的集合 cr ( A >, 这就是 A 的特征值集合. 

I. 1.2 定义设 A € M „， xeC \ 考虑方程 

Ar = Aj • j •关0, (1. 1. 3) 

其中 Aft 纯 M . 如果纯 MA 和非零向愴^恰好满足这个方程，那么 A 称为 A 的一个特征值，而 
J •称为 A 的 W f A 的特征 向量. 注意，这两个槪念不可避免地要成对出现，并且，特征向撖不 
能是零向 fi . 

1 . 1.4 定义的所有特征值 A € C 的集合称为 A 的谱， i 己作 A 的讲半径是非负 
实数 〆 A ) = max { A 丨： A 6 tT ( A )}. 这正是包含 A 的所有特征值的、_心在复平面原点 的敁小 
1 MI 盘的半径. 

练习如果的、《于义的特征向械，证明 . r 的任一非零纯贵倍数也是特征向 M . 

且不说特征值和特征向 M 有无其他用场，仅从代数上肴，它们也有意义，因为，根据 
(1. 1.3>，特征向檄是这样一些向搶，将它们乘以 A 后有非常简申的形式——同乘以一个纯量 
H ] (特征值）效果一样. 

例考虑矩阵 

a = [: ' ；]e m, 

因为 

價 H ;]， 
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于是，有 36WA ) 及相应的特征向馕同时， 56 a(A). 可以求得相应于特征值5的特征 
向最. 

我们知道，多项式 

P^t) = a k t k -f a k -1 /* 1 十 … + a" + 

在矩阵 A6M„ 处取值是有明确定义的，这是因为可以自乘方阵得到-•个正整数幕，并且可以 
作出同阶矩阵的线性组合，于是， 

p ( A ) = a k A k + a* iA* 1 + …+ “ ,>\ + j. (1. 1.5) 

请注意一个有用的事实，通过多项式的关系得到的与相关的矩阵与 A 有相同的特征向 
«：；它的诸特征值与 A 的特征值有简单的关系. 

1.1.6 定理设 /»(•) 是给定的多 项式. 如果 A 是豸€^^的特征值，而 x 是相应的特征向置， 

那么 A(A) 楚矩阵 />(A) 的特征值，并且 j •是属于 〆 A) 的特征向量. 

证明： 考虑 />(A)j*. 首先， 

p { A)x = a k A h x I- Uk - xA * 1 j •十… a, Ar + a 0 x . 

其次，反 S 应用特征值一特征向世方程便有 AV = 'Ar = A-' Aj - = AAWt = … =A， 二 
因此, 

p(A)x = f ― 十 = (u*A* + … + ci 0 )j* = p(\)x. □ 

练习如果 <y(A) = {-l，2}, A6M 2 , (KA 2 > 是什么? 

练习如果 D=di ag (c/,, ，…， A) 是对角矩阵 （0.9. 1), tr(D> 是什么？给出每一个特 
征值的相应的特征 向镦.提示： 考虑标准基向 Mn, /-I, 2, [36 

117论断矩阵 AeR 楚奇异的，当且仅当 oewA). 

证明： 矩阵 A 是奇异的，当II仅当对某个 x 垆0, Ax = 0 . 这个关系式成立，.当 R. 仅当对 
某个 r 关0, Ax = 0.x , 即当且仅当 A = 0 是特征值. □ 

习题 

1. 假定是非奇异的，根据（1.1.7)，这等价于说 A 没有等于零的特征值.如果 
A 6^( A ), 证明 AdGcKA - 1 ). 如果 Ar = ^ r ， 且 a •关0,给出 A 1 的厲于 A* 丨的一个特征向撖. 

2•如果 Ae/vt 的每一行的各分*之和（简称为行和）是1，证明 leWA ). 提示： 考虑 
向* e =[ l ， 1，…， 1] T , 然后说明， A 的行和都相等，当且仅当 e 是 A 的特征向 M . 如果 
A 是作奇异的，证明 A 1 的行和也是 1. 给定多项式/>(/>，证明 /»( A ) 的行和都 相等. 它等 
于什么？ 

3•设 AeM ( R ), 如果 A 是 A 的一个 实特征值 ， a Ax = Ax , 0^ j 6 C n , 设 
其中6 是^■的实部和 虚部。 证明和 A 7 = A 7 ; 由此推出存在 A 的属于 A 的实 

特征向 M 。 S 和7?都是 A 的特征向*吗？可能有 A 的属于一个复的非实特征值的实‘特征向 
量吗? 

4. 考虑分块对角矩阵 （0.9. 2) 



证明 A 的特征值由 A u 的特征值和 A 22 的特征值组成. 提示： 先用4„和 A 22 的特征向 M 表示 A 
的特征向量. 

5. 设 AeM ”， 如果 A 2 = A , 就称 A 为幕等矩阵，证明幂等矩阵的每一个特征值是0或 1. 

6. 设 A 6 M ”， 如果对于某个正整数心 A 9 = 0, 就称 A 为幕零矩阵，上述最小的 g 称为幂 
零指标.证明幂零矩阵的所有特征值都是 0. 顺便给出一个其特征倌都是0的非零矩阵的 
例子. 

HZJ 7 . 我们将看到，在集中要讨论的有限维结构中，每个复的或实的方阵都有一个复特征值. 

但是，对于一个无限维向馕空间上的线性变换 • 就可能没有任何特 征值. 设 V 是由诸复数的 
形式无限序列组成的向《 空间： 

V = < (山•…， a " …〉： “• 云 C,i = 1,2, — } , 

并且定义 V 上的线性变换 S 为 

S ( a , * a 2 ,•••) = ( 0 9 ai , a 2 *•••). 

这个线性变换有时称 为移位 算子，验证 S 是线性变换，并证明 S 没有任何特征值.提 示：证 
明，如果一个向 W 是特征向鱿，它的所有分 M 必须相同，而这个公共值只能是 0. 因此，所给 
出的向 》 必须是零向它不可能是特征向 M . 

8•设矩阵 AeM ”， 如果 A ’ = A ( 见 0. 2. 5)，就称 A 为 Hermite 矩阵，如果 A 是 Hermite 
的，证明 A 的所有特征值都是 实數.提示： 设是任意的，并 fi 设 a •是相应的特征向 
域，于是 （1. 1. 3>推出， Hi ! r . 但是 P Ar = jr ' A % j = Aj , 所以 j •九 r 是实数.因为 
J > 是正的，所以 A 也是实数. 

1.2 特征多项式 

关于 A 6 M ，， 的特征值，一个 A 然要问到的问 题是： 4有多少特征值？可以怎样来描述它 
们的特征？ 

特征值-特征向 M 方程 （1. 1. 3>可以等价地改写成 

( A / = 0, j •关 0. (1.2. 1) 

因而， A 6 ct ( A ), 当且仅当 A / — A 是奇异方阵，即 

det ( A /- A ) =0. (1.2.2) 

1.2.3 定义的特征多项式 定义为 

P .^ t ) = det (// — A ), 

把它看作/的形式多项式. 

注意 用/作为特征多项式的形式变元 • 为的是把它和一般的特征值或多項式的零点 
A 区别 开来. 在其他地方，有时用同一个符号表示它们 • 

一 1.2.4 论断如果则特征多项式 />“•） 的次数为”，并且的根的集合就是 
JA \ (7( Ah 
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证明： />.“•> 有次数”可以归纳地从 det(f/ — A> 的 Laplace 展开式 推出： 当行列式展开时， 
tl-A 的每一行仅提供 r 的一 次幂. 第二个论断与 （1.1.3) 和 （1.2.2) 等价. □ 

练习证明， det(A —//) = 0与 det (// — A) =0有相同的根，并且证明， det(A — / /) = 
(-l)"det(r/-A). 因此，特征多项式又可以（并且有 时就） 定义为 det(A — /J ). 证明所定义的 
特征多项式保证的（首项）系数总是 + 1. 

练习如果 ^1,证明 — + ( 以一&)，且 


< t (A) = +你}. 

设 A € M 2 (R ), 证明，如果则 A 的特征值是实数.此外，它们是实数，当 R 仅当 
( a - d ) 2 f4^>0, 如果不是实数，则成复共朽对出现. 最后 证明，如果 U — d) 2 +4 &关0,则 
特征值不相同. 

在某些一般的悄形，矩阵的特护㊆ 妃宵 妨會出 来的. 最常见的是因矩阵的形状而使行列式 
容易计算的 情形. 其中包括对角矩阵、矩阵和一些其他特殊情形. 

练习证明，如果 * T€M f 是7 角免阵 


那么 ( 7 ( T ) = { t n , t u ， 
练习设矩阵人 


L0 /' 

即了的诸对角元之集. 
的每个元都等于1: 


J 2 的特征值是什么？证明 0( 出现两次）和3是 J 3 仅有的特 征值. 由此类推，人的特征值是什 
么？提示：考虑向 M e=[l, 1，…， 1] T . 

练习确定矩阵 
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A = 


3 一 


的所有特征值和相应的特征向 提示： 利用前一个练习，并写出 A = 4/ —九. 


1.2.5 定义从 （0.7.1) 可知， A6M” 的 々XA 主子矩阵是位于有相同指标的々个行和&个列的 
子矩阵，而々X々主子式是这个主子矩阵的行列式. A = [心]有个不同的 々 XA 主子式，用 

N 

表示这些子式的和.特别地 .E,(A>= •称为 A 的迹•通常记作 trA 或 trace 凡注 




意， E „( A ) — det A . 

练习如果 AeH ， 证明 p A (/) = P — （tr A ) f+det A , 且 2 义 = tr A 和 JJ A = del A . 

一个基本的，但并非显易的事实是，复系数 n 次多项式在 k 数范围内恰个零点（重 
零点按重数计 算）， 称这个搴实为代數基本定理（附录 C ). 由此，可得到如下車:要论断. 

1.2.6 论断每个矩阵在复数范围内恰好有《个特征值 （歌特 征值按重数计算）. 

注意这里，当提及的一个特征值的“重數”时，就可简单地理解为 A 作为特 
征多项式 /> A (0 — 个零点所出现的次數.更全面地讨论特征值的重數将放到 （ I . O 节， 
不过，知道多項式的各阶导數与该多項式的一个零点的重數之间有一定的关系是有用 
的.多项式/ >(/) 有 A 作为走彡1重零点，当且仅 当户⑴ 可写成 〆 /> = (/—⑴的形 
式， 其中 〆 /) 是使乒0的多 项式. 微分这个恒等式就得到/»'(/)=々(/一>0*-、(/) + 
( t - X ) k q \ t ), 并且从这个表示式可以看出， p / ( A ) = 0, 当且仅当 A 〉 l . 如果々>1， 
〆 '(/)=々(々一 1) G —+ 每一項含有一个因式 （/- A )*" 的多项式，其中 
— 1•于是， />"( A )=0, 当 IL 仅当々>2. 重复 上述计算便可证明， A 是 />(/) 的々 
[ TO ] 重零点，当且仅当 /> U > = p ' U>=^.. = 〆 *—” U >=0， 而 />〈*，（>0乒 0 . 


1.2.7 例命题（1.2.6>与 以下枣 实密切 相关： 复数域是代數闭域，也就是，每个 系数在 该域 
中的” 次多项式在该域中有《个零点.对于 K 他域上的矩阵，例如实数域或有理数域，一般几 
乎不能说出一个矩阵在该域上有多少特 征值. 但是，再看一看 （1. 1>节的习勉8,它却是能说 
出特征值的某 些悄况 的一个 例子. 在任诳域的情形，一个矩阵也可能根本没有不 N 的特征值. 
矩阵 

ron 

、八 (1. 2. 7a) 

L— 1 0 」 

的所有元尽管都是实数，但它没有实特征值，矩阵 

卩1 0 1 


.. (1.2.7 b ) 

鲁 • 

• • 

1 

- 0 1 . 

不管它是几阶，也只有一个 特蜱的 特征值 U 歌特征值1〉. 

练习验证 （1.2. 7) 中的论断. 

练习如果 AeM "( R )， 且”为奇数，证明 A 至少有一个实特 征值.提示： 一个实系数多 
项式的任何非实复零点，必须成共轭对出现，并且注意到，如果那么有实 
系数. 

根据（1.2.6)，可以把的特征值排成 

义1 ，又2， … ，A- ， 

其中的顺序是任意的，并社按其東数重复这些特 征值. 于是 • 因为（1.2.4)，我们得知 
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/»_“/) = ( / 一 Ai )( / — A ；； )•••(,—) • 

1.2.9 定义《个数 A ,， …， A ,， k ^ n , 的々次初等对称函数是 

k 

S* (Ai •… ， A") e 2 JJa^ » 

1 恭,、•务 €；_ ) — 1 

它是所有个取 fUp "•• Ai 的不 N 项的1次乘积之和. 

例如， S,(A,. A>=A ，十…十是诸 A , 的和 • 而 S “ A ,， …， …; U 是诸的乘 

积.因为 U.2.8> 以及是用《个行列式定义的，在矩阵 A 的特征值的初等对称函数 
S*(A ,， …， U 与 A 的各IX々主子式的和 E*(A>(1.2.5) 之间存在某种 关系. 以下两个恒等式 
是 ffi 然的，费点功夫便可验证： 

(/ —A, )：••(/ — A,) =r — S,(A | ，…一 S 2 (A| ， … ， Ad/r 2 

—…士 iU ■•… 义 >， （1.2.10) 

以及 

P 山 、= r — 十 £ 2 <A )，_ 2 — 士 E；M ). (1.2.1!) 

练习验证 （1.2. 10〉和 （1.2. m . 前者可以通过计算乘积 G — A , >(/ — &)•••(/ 一; u 中 * 
的系数来直接验证，后者可用 Uplace 展开式归纳地验证. 

综合 （1.2. 10)、 （1.2. 1丨）和 （1.2.8). 有下 而的 定理. 

1.2. 12定理如果 A , •…， A n 是的特 征值. 那么 

S*(Aj ， … ， A,) = K k (A). 

A 的特征值的々次初等对称函数是 A 的各主子式 之和. 特別地 

tr A = 2] a , 

#■1 

和 

19 

det A = JJa,. 

卜 I 

习题 

1. 用 （1. 2. 12> 验证 （1. 1. 7). 

2 •对于矩阵 A6M …和[见 （0.2. 丨>]，通过直接汁算证明 u AB = u BA . 再用这 
个事实证明，对/和非奇异矩阵 SGAf ”， trS , AS = tr /\. 矩阵 S MS 称为/\的相似矩 
阵，上述结果说明，迹是相似不变 《• 相似性是下 一节的 主题，并且将会看到，所有主子式之 [42 
和 E*(/V) 都是相似不变量.注意，因为乘法性质，行列式显然是相似不变讀. 

3. 如果 D6M” 是对角矩阵，计算特征多项式 /> D (/>， 并证明 p D (D) = 0. . 

4 - 设设次是划去 A 的第 f 行和第 :• 列后所得到的 A 的主子矩 
阵，/ = !，•••，《.证明 

= 士 A '(，). (1.2. 13) 

1=1 


( 1 . 2 . 8 ) 


41 
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5. 回忆前一节的习题6,证明幂零矩阵的迹为 0. 幂零矩阵的特征多项式是什么？ 

6. 如果是= 0的单重根， A 6 M ,, 证明， rank ( A - A /) = 7 i - K 但反过来不 
一定成立[想一想例 （1.2. 7 b )]. 提示 : 利用 （1. 2. 13)和 / = A 0. t ( d / d /> p A (/)# O 推出， A - XI 
的各个〃一 1阶主子矩阵是非奇异的. 

7. 用 （1.2. 12) 确定矩阵 

'1 1 0 0 0 * 

1110 0 
0 1110 
0 0 111 
0 0 0 1 1 

的特征多项式.考虑如何利用这个方法计算一舣的 / iX/, 二:对角矩阵 （0. 9. 10) 的特征多项式. 

8. 如果 0 ( A ) = U l , 假定二 Uf , …， V }.证明对所有正整数 A 

tr A 4 - 士 Af . 

等式右边的和称为 A 的诸特征值的々次 矩. 由 （2.3.1) 知，所作假设成立. 

9. fl 接计算 , •••• 夂）， S 3 ( A ,. A s ), …，和 ，…， A 6 ). 

10. 设 V 足域 F 上的向献 空间. 线性变换了： 的特征值是纯 Ma € F ， 使得有一个非 

HU 零向适合 7 V = Av . 证明， 如果 F 是 g 数域， tLV 坫有限维的，则每个线性变换 T 

有一个特征偯.绐出例+说明，如果其中一个假设条件（ V 的有限维性®或 F = C ) 减弱，那么 
了可能没有任何特征值. 提示： 设3是 v 的基，并考虑 [: TU 

11. 设…十…/ + “,,， Ci .- l , 是给定的首系数为1的多项式，具有 
零点 Ai ， …， 计相® 零点诸零点的々次紐 id 作~ = *1 A ? +… + W ，6=1，2，…. 
证明 Newion 恒等式 

k a “ I *.2 + … +#*“《■= 0.^ = 1 .2, — ,/i. (1. 2. U) 

说明为什么诸零点的前儿个矩唯一地确定多项式^"的诸系数（因而确定诸零点），反之亦然. 
提示: 证明，对某个尺>0,如果丨/丨>/?，耶么 l +X,t 2 + A ?/ 3 十…,因而 

M 

/(" 三 1 = fit 1 十； i,/ 2 +// 2 / J + …， I / |〉亿 

1*1 

证明 〆 G ) = p ( r )/( r>， 据此， Newton 恒等式以及关于较高次矩的另一恒等式 

^ a 0 H - 十 /ir* I =0 ， k = 1 ,2,— 

可以通过比较系数推出. 

12•设 .4. 是给定的 矩阵. 证明， y \ 和 B 的特征值相同，当且仅当 tr K ， 

々 = 〗• 2，…，仏 提示： 利用习题8和 Newton 恒等式 （1.2. 14>证明 y\ 和 B 的特征多项式 相同. 

1.3 相似性 

正如在（1.0>节所指出的，中的一个矩阵的相似变换对应于 C 上的一个线性变換在另 
一个基卜的 表示. 因此研究相似性可看成是研究一个线性变换所固有的性质或它的所有基表示 
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所共有的性质. 

1.3.1 定义设矩阵 A , B 6 M ,., 如果存在非奇异矩阵使得 

B = S 1 AS 9 

则称 fi 与 A 相似， 而变换称为由相 似矩阵 S 确定 的相似 变換. 关系 “ B 与 A 相似” 

有时简记作 B 〜 A . QT ] 

1.3.2 论断相似是上的一个等价 关系； 即相似是 

( a ) 自 反的： A 〜 A ; 

( b ) 对称的： B 〜 A 推出 A 〜 

( c > 传 递的： C 〜 B 和〜 A 推出 C 〜 A . 

练习验证 （1.3.2). 

像任何等价关系一样，相似关系把集合划分成互不相交的等价类. 每 一个等价类是 
R 中相似于某个矩阵（该类的代表 > 的所有矩阵的 集合. 在一个等价类中的所有矩阵都相似. 

而®于两个不同类的矩阵不 相似. 由于传递性，仵任何一个相似矩阵的有限序列中，第一个矩 
阵和 M 后一个矩阵在同一个相似等价 类中. 一个至关重要的结果是，任一个等价类中的矩阵共 
冏具冇许多里要性质.其屮一些将在这里论述，而关于相 似不变 f 的一个较完整的描述（例如， 

Jordan 标准形）将放在后面的第3章. 

1.3.3 定理设 .4, B ^ M h . 如果 《和泌 相似，那么《的特征多项式与 A 的相间. 

证明： 对任意/,我们冇 

/>«(/) = det (// — B ) 

= det(/S ' S-S ' AS ) = det S ' UI - A)S 
=det S ' dct (// — A)det S 
=(det S ) 1 (det S ) det (// — A ) 

= det (// 一 A > = □ 

1. J .4 神论如果 A ， B 6 Vf n , 且 A 与 ft 相似，那么它们有相同的特征值（重特征值按重数 
计 算〉. 

1.3. S 冽有相间的特征值是相似的必要条件，但不是充分条件，考虑矩阵 

ro n < po on 

和 ， 

L 0 OJ Lo 0 」 

每一个都有二重特 ili ： 值 o , 但它们不相似. 

练习¥明与零矩阵相似的矩阵只有它本身，然后利用这一事实验证例 （1.3. 5>中的论断. [ J 5] 
练习 S ( I 果矩阵 A ， 相似，并且 W ) 是多项式，证明与 (/(«) 相似. 特别地， 

证明，如果《是纯坩，那么 A + a /， 与 B + a / 相似. 

练习如果 A ， B ， D 6 M .., 且 A 〜 B 和 C 〜 D 是经 同—相 似矩阵 S 实现的，证明 A + 

(，〜 B + D . 

练习如果 A ， S 6 M „, 且 S 是非奇异矩阵，证明 ' AS ) = E *( A >, 特別是 ， det S'AS 



= det A 和 tr S 一 A ， 即行列式，迹和 其他的 A X ▲主子式和是相似不变贵. 

练习证明秩也是相似不变 M : 如果相似于 AEAt , 那么 rank rank A •提 
示： 见 （0.4.6). 

W 为对角矩阵特別简单，又有很好的性质，因此有必要知道，对于哪些矩阵 A6R ， 在 
A 的相似等价类中存在一个对角矩阵 • 即哪些矩阵相似于对角矩阵. 

1.3.6 定义如果相阵与一个对角矩阵相似，那么就说 A 可对角化. 有时也采用术语 
可对角的. 

1.3.7 定理设那么， A 可对角化，当且仅当 .4 有《个线性无关的特征向量. 

证明： 如果义有，/个线性无关的特征向 M /"， …， /•’， 以它们为列作非奇异矩阵 
通过计算， 

S'AS= SW^ArdAr 1 -》] 

= s '[A.y'-A.x^] = s i [y ,, -y , ~\a 

=S l SA = A, 

其中 

A, 0] 


[ TiU ,, …， A ， 是 A 的特征值. 

反过末，假定存在相似矩阵 S 使得足对角矩阵.于是九 S 二 SA . 这就是说 ， A 
乘 S 的第 I 列（即 AS 的第/列）是 A 的第 I 个对角元乘 .S 的? fW 列（即 SA 的第/ 列）， 或齐说， 
• S 的第/列进 A 的相应于 A 的相应于/\的第/个对角元的特征向 W 为 . Sfill : •夺异的，所以 
存在〃个线性无关的特征向 M . □ 

更注意的是， （1.3.7) 的证明原则上是关于对角化一个可对角矩阵的 算法： 求/\的各特征 
值：求相应的各个特 征向域 （考虑重特征值>，然后把它们排成矩阵 S . 如果诸特征向 tt 线性无 
关，那么 S 是一个对角化相似矩阵.但是，我们要着 ® 指出，这只是粗略的分析件解释，不是 
实际的计算方法. 

附注如果 AeM ” 可对角化，与 A 相似的任一对角矩阵的各对角元必须是 A 的具有 

适当重教的特征值.此外，线性无关的特征向量（它们组成相似 矩阵） 必须对应具有适 

当重数的不同的特征值；即，如果^是线性无关的特征向量，且/>. 4 (/)== 

那么，对诸指标的某个排列 r , 有 Ar “，= AW 》. 

练习证明矩阵 .4= = U 不能对角化 • 

其理 由是： 一方面是因为，如果它可对角化，它将相似于0矩阵，而这是不可 能的； 另一 
方而，经计算 • 除 r 差一个比例因子以外，只存在一 个属于 0的特征向 M . 

练习如果 A 可对角化，而 “•） 是一个多项式，证明 g ( A ) 可对角化. 提示： q ( SAS ^ 1 )^ 
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练习如果 A6A 九，且 AGWA ) 作为 A 的特征值有1数 w ， 证明，如果 nmk(A — A /〉> 
『 m , 那么 A 不能对角化. 

保证可对角化性质可行的一个简单情形是矩阵的各特征值互不相同.这个事实的一个重要 
前提是下述引理，它还有其他 用途： 

1.3.8 引理假定 A , ，…， A * 是的两两不相同的特征值，而 x …是相应于 A , 的特征向 
«，/=1，…，々.那么 U ⑴•…，是线性无关组. 

证明： 证明实质上是用反 证法. 相反，假设/"， …， 是一个线性相关绀，那么存在 
一个等于0向世的非平凡线性绀合， 并&实 际上有这样一个线性组合，它的非零系数最少.假 
定这个极小的线性相关关系式是 

ai J. u ， + a:j* ‘ ?> + …+ a r J~ <,} =0 ， r ^ k. 

W 为所有/"尹0,有 r >】. 为方便起阽，可以假定它包含前 r 个向械 （如果必要， 可® 排编 
号）. 同时 • 还有另一个相关关系式 

A(tfi j ,n + …+ a , a . … ） =⑴ Ar u ‘ + … - ha , Aj - ,r ' 

=a ( Ai *' * …个 <T,A,*r … = 0. 

现在用 A , 乘第一•个关系式，然后从第二个关系式中减去它便得到第三个相关关系式 

oi (Ai — A r ). r in + …十 av , ( A ^ i 一 … 1, = 0, 

它的非芩系数比第一个关系式要少.因为 A , 关 A r , i _=1, 2,…， r -1, 这最后一个关系式是非 
y •凡 的. 这就与第一个相关关系式的极小性假设相 矛©, 因而得证. o 

1.3.9 定理如東 A6M n 苻《个互不相 同的特 征值，那么 A 可对角化. 

证明：如果 〆 A ) = U • 夂丨 • 设’是相应于 A , 的特征向请.因为特征值都各不相 
N ， 根据（1.3.8〉，{/"，•••，了°°>是线性无关组，因此， 洱由 （1.3.7) 可知， A 可对 角化. 

练习给出一个可对角化矩阵的例子，但它没冇互+相问的特征值. 

练习由 （0.9. 5) 想到， a 换矩阵 P 是其每一行和每一列中恰有一个分 M 为1的以0, 1为 
分 M 的矩阵 . WlW P r ^P 证明的一个 ffi 换相似®排 A 的诸对角元，然后证明，对 
任一刈角矩阵，存在一个罝换相似矩阵，使其对角元可按任意顺序重排，特別是任一*复出现 
的对角元可相邻地排放在一起. 

矩阵 A， 关于乘法一般不交换，但是，如果 A ， 13都是对角矩阵，它们总是可交换 
的. 这后一个结论珥以做些推广； 在这 方面，下面的引理是有益的. 

1.3.10 引理设和是给定的矩阵 • 且设 



是 A 与 B 的直和，那么， C 可对角化，当且仅当 A 和/3都可对角化. 

证明：如果存在非奇异矩阵和非竒异矩阵 S 2 eM w ， 使得、 SrMS , 和5 2 15 2 都是 
对角矩阵.那么容易验证 S ^ CS 是对角矩阵，只要 S 取直和 
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L o s 2 」 

反之，设 c 可对角化，存在非奇异矩阵使 SdCSsA ^ cliaga ， A 2 ，…， A „^) 是 
对角矩阵.如果用 


•S = r f， le C^"，e 6 c\r/, 6 C- • y = l ， 2，-，w + w 

-7*」 

表示 = 那么， 对， =1，2，…，”十 / w ， 05,=入乂推出八乞= 1 ^,和巧,= < ^,如 

果在集合 ％,…，^ + • 无关 ㈦ M 少于《个，则矩阵 

[ fif 2 … U € 

的列秩（因而行秩 > 将小于 《• 同理 • 如果在集合{ 7 | ,…，％,_丨中，无关向 M 少于 m 个，则 
矩阵 

[7 H - 

的列秩（因而行秩）将小于在其中一种（或 两种） 情形下，矩阵 


s = O … w 两]= 

17> 


匕 .㈣ 

6 M 一 

7« r » 


的行秩（因 而秩〉 小于” + Wi W 为 S 是可®的，所以这是不可 能的.因此， 在集合 a， 匕，…, 
丨中恰有 h 爹线性无关的向械，又 K 为这每一个向被都是 A 的特征向攢，所以 A— 定可对 
角化. 同理司 a 矩阵《可对 角化. 匸] 


1.3. 11定义我们说两个6对角化笵砗/\， seM. q?r 可对 角化，指的 楚存在 同一个相似矩 
111] 阵 S€M”， iHnS ^ AS^S as S& 是对角矩阵，即，如果存在同一个基，在这个基下，两个 
线性变换的表示都是对角矩 PV. 

练习证明，如果 4. 同时 DjK 角化. 那么它们可 交换.提示： 写出和 

B = SES 、， D 和 E 都是4角矩阵.然后利用对角矩阵是交换的事实计算 AB 和 BA . 这种处 
理方式会经常用到. 

练习证明，如果 At.Vt 可对 角化， 而 A/ 是 Ai” 中的一 个纯綾 矩阵，那么 A 和 A/ 同时 
可对角化. 


1.3.12 定理设 A. B6A^ 可对 角化. 那么，/\和《可 交换. 当 fl 仅当它们同时可对角化. 

证明： 假定 A 和 B 可交换，在 A 和《上同施以一个相似变换使 A 对角化，因而，不失一 
般件，可以假定 A 是以角矩阵，仍不失一 般性. 再假定 A 的任一多重特征值相邻地出现在主 
对角 线上. 因为 AB = /3A (上述公共的相似变换不会改变这一关 系）， 所以有 

AA , = M >* 

其中，《 = !>•,]，而 A, •…， A, 是 A 的各特征值.因为=0，由此可知，只要 A, 关 
，就有心 =0. 因此， 接上面已经给定的 A, 项的顺序， B 是分块对角 矩阵： 


B , 0 

B = ••• 

0 B t 


(1. 3. 13) 
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其中，对于/\的每个不同的特征值，有一个子块 B ,. 每个 B , 是一个方阵，其阶数是与它相应 
的 A 的特征值的 蜇数. 因为 B 可对角化•根据 U .3. 10)，每个可对角化.设 7', 是使 
T 7^, r , 为对角矩阵的非奇异矩阵.因为 A 有分块形式 


A = 

其中每个纯 钕矩阵 A ,/ 与坟同阶，我 们呑到 T 与了-…了都是对角矩阵，其中： T 是直和 L5 '^ 

T , 0] 

T , 

. • (1.3. 15) 

參 

參籲 

0 T t . 

注意， T , ' A ./ T .- A ,/. 

逆命题已包括在前面一个练习中. □ 

作为本竹的结束.把 （1.3. 12>推广到较大的矩阵集合，并 II 对不可对角化矩阵的悄形给出 
一个较弱的结果. 

1.3.16 定义 矩阵的一个族是矩阵的任一 （有 限的或无限的 > 集合 • 而交 换族是 其每一 
对矩阵在乘法下都是可交换的族.我们称子空间 VVGC ” 对是 A - 不变的， 是指 
对每个 成立； 称 W 对族 •是？ -不变的， 是指 W 对每个歹是 A - 不 变的. 

注意 • 加果 C ” 的一维不变子空间中的每个非零元家是 A 的特征向 W . 

练习设 A 6 M ”. 如樂 W 是维数至少为1的 C ” 的 A - 不变子空间，证明在 W 中有/\的一 
个特征向 提示： 选取 W 的一个基，然后考虑作为 W 上的线性变换 7': 的基表示 

矩阵.证明这个矩阵有一个特 征值. 要 点是： 为什么 T 是 W 上的线性变换？ 

一个 R 要的结论珐下面的引理. 

1.3.17 引理 如果是交换族，那么，存在向 SieCT ， 它是每个胥的特征向贵. 

证明： 设是有最小正维数的孓不变子空间：这样的 W 存在，但未必唯一•因为 
C " 本身就 是界不 变的，所以知道冇一个”维孓不变子 空间. 如果存在”一】维:?-不变子空间， 

那么就要问是否存在，一2维 •>•- 不变子空间， 等等. 实际上，只要证明 W 中的每个非零向虽 
是每个的一个特征向景，就完成了引理的证明.假如上述情形不成立， 那么. 对某个矩 UY ] 
阵 A €>， 并非 W 中每个非零向姑都是/\的特征向最 • 但是，因为 说是1 不变的，所以它是 
A - 不变的，因而在 W 中有 x 彡0，使得儿 r = A * r 对某个特征值 A 成立.定义％ = {<% Ay = 

& v }， 于是 je W 。， 且 WuQVV 是一个子 空间. 因为关于 A 的假设， W 0 ^ W , 因而的（正） 

维数严格小于 VV 的维数.设如果 i 6 W „， 则有这是因为且 W 是少- 
不 变的. 但是另一方面，因为 J 是交换族， A ( Rr ) = ( AB ) x =( BA ) x = B ( Ax ) = B ( Ax ) = 






A ( Rr )， 因而得出 Rr 6 V ^、. 由此可知，…。是令-不变的.但因为有严格低于 W 的正维数, 
这就产生了矛盾.证毕. □ 

引理 （1.3. 17> 是关于仃意基数的交换族的.特別是， 如果歹 =彳义， B } 是只有两个矩阵的 
族.那就是说，任一对交换矩阵有一个公共的特征向揿.定理 （1.3. 12) 是说，如果 A 和 B 不 
仅可交换而且每一个也都可对角化，那么它们同时可对 角化. 我们的 F —个结果要证明，关于 
两个可对角化矩阵的交换族的上述性质不是它所特存 的； 这个结论 of 以推广到 H 有任意基数 
的族. 

1.3.18 定义 同时可对角 化的族 JCZM , 是这样一个族， 关 f 这个族，存在同一个非奇异矩阵 
SeJK , 使得对每.个 S 1 AS 是对角矩阵. 

1.3.19 定理 设是由坷对角化矩阵绀成的族.那么 • >•是交换族 • 当且仅当它是同时 
可对角化的族. 

证明： 如果 •> >1时吋对角化，那么，根据前面的 练习， 它交換族.对《作归纳法来证明 
Ji : 逆命题.如果”=1，就没有什么可证 的了. W 为每个族既 M 交换的， 也楚对 角的.假设 w >2, 
并 假定， 对 々 =K 2，…，”-丨 • 关于满足假设的所有 AX / r 矩阵族，结论已经证明.如果孚 
的每个矩阵足纯阵，那就无须证明， 因此， Sf 以假定，是某个 H 有特征倌 
&••••， A * (其中至少有两个不相同， 2<« W ) 的” X « 可对角化矩阵，还假定，对每个矩阵 
队 li 每个 角化. 采用与 （1.3. 】2>中相同的论证，可以把悄况简化 
为， A 实际上 M 对角矩阵， A 的彳 t - •多币:特征值相邻地出现， ii 特征值的顺序是闶定的，即 A 
有形式 （1.3. 14>. M 为毎个麥与 .4 交换 •（1.3. 12> 中证明，每个 Be . 多有阶数为丨或小 
十”一丨的矩阵 K 和形式 （1.3. 】3>. Ad . 3. 13>中<•块的阶数和位背完全由 A 的诸特征值的重 
数和顺序所确定， W 此， Xjf 所為朽6.?，它们 都是相同的. ㈥ 为，所有矩阵 BO •都坷交换 
(不只钴与 A >， 每个•有一个 | [和形式 （1.3. 13)，所以， 々•中 任-矩阵的 A 个茛和被加 
T •块中的每一个都是>•的其他每个矩阵的相应子块 HJ 夂换，并且，根据 （ L 3.10 K 这每个子块 
都可对 角化. 由归纳假设，存在 A 个相应阶数的相似矩阵•/•,， T : . …，7\，它们中的每一个 
都使 >'中的每个矩阵的对应十•块对角化.正如 （1. 13. 15) 中的飪和那样，莨和 T , ㊉ T 2 ㊉…㊉ 7' 
侦7中的每个矩阵对 龟化. a 

附注与这一节相关的两个重要问題将推迟到第3章 讨论： （1) 给定 A , BeM ,， 如 
何确定 A 是否与 B 相似？这是促成求相似下的标准形的动机 •（2) 不计算已知矩阵 
的特征 向量， 我们如何判别它是否可对 角化？ 

作为交换性的最后一个附注，我们注意到，虽然与未必是相同的矩阵（并且即使 
两者都有定义，它仍未必是同阶的 >• 但是从它们的特征值来看，几乎是相同的，如果 A 和 B 
都是方阵，和 BA 恰有相同的特征值. 

1.3.20 定理假定 A6M _’ K 那么 R 4 与 AB 有相同的特征值 （ 黾特征值 

按重数计算），再附加”一个等于0的特征值：即/^(“二广 >仙（/).如果 w = 且八或 
B 至少有一个非舒异，那么与 BA 相似. 
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证明： 考虑以下两个涉及中的分块矩阵的恒 等式: 


因为分 块矩阵 


「AB Oirl [AB ABAl 

L B oJlo /」— L S /M 」 
n Airo o 1 rAB abai 

Lo / 」 Lb BA」—L B BA 」 



IP 奇异（它的所冇特征值是+ 1>，得出 



:] [ ZH : 


0 ■ 
BAJ 


即两个 （ m 十《 ) X (w + w ) 矩碎 


L Fj 


0 - 


和 


■0 

-B 


0 • 
BA . 
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相似. C , 的特征值是 AB 的特征 ( R . f 4 加 介零. C 2 的特征值是 /3 A 的特征值冉加上 m 个零. 
W 为根据 （1.3.4), C , 与 C 妁特 }; .值作同（汁■蜉征 值）， 所以定理的主要论断已经证明. 
M 后一个论断可从以下结柒推 出： 卯采 A 是作奇 并的. 且 ， n = n ， 那么 ' 

习题 

1. 如果 A , «6 M „, 江/\与13可交换，证明 A 和关予 B 的任一多项式可交换. 

2. 设 A ， M ,. 且有 a ( A > = U ,, •••• I 丨和 〆 《> = {〜，•••，如果 A 和 B 可对角 
化，且可交换，证明 • 存在1，…，”的某个排列；，，…，/，，使得 A + B 的特征值是 

Aj 4- ,X ： f fi , ； . ― . A , 4* fx , . 

3. 如果 和/ \ = S l DS . D = diag ( J , • d m ). 且 /»(•) 是多项式，证明 />( A ) = 

S V (/)) S 和 pU )) = diag (/ >(4)， …， pU n )). 只要能使 A 对角化 • 这就提供了计算 〆 A ) 的 
一个简便方法. 

4. 绐出两个交换矩阵不可 间时对 角化的 例子. 这与定理 （1. 13. 12>矛盾吗？ 

5. 如果 A 6 M ,, 冇互不相同的特征值，且与给定的矩阵可交换，证明 B 是次数至 
多为《 - 1的关于/\的多 项式.提示： 采用在定理 （1.3. 12) 的证明中使用过的方法，证明 B 和 
A —定同时可对 角化. 然后想到，给定互不相同的数 a ,， …， I 和…，戽，存在一个次数 
至多为 n —\ 的 （Lagrange 插值>多项式 />(•), 使得 p ( a ,)=/?,. 见 （0. 9. 11). 

6. 如果可对角化，考虑特征多项式证明 h ( A ) 是零矩阵. 

7. 设矩阵 A ，《6 M n ， 如果就称 A 是 fi 的平方根.证明 Af „ 中的每个可对角化 
矩阵有一个平方根. 

8. 如果 A , B 6 M ,, 且至少有一个有互不相同的特征值（关于另 一个， 甚至连它可对角化 
都没有假 设）， 证明， A 和 B 可交换，当且仅当它们同时可对 角化. 提示：充分性的证明是容 
易的；至于必要性，试图采取如下形式的论证来作为 （1. 3. 12) 所采用的方法的一个 补充. 假定 



B 有互不相同的特征值 • XG ( j ( B ). 且 Rr = 及 j * / 0. 于是 B ( A _ r ) = A ( B . r ) = AX.r ~ XAx , 
由此推出 Aj •也是的诚于 A 的特征向 ft . 因为不 可能存在两个这样的线性无关的向 tt (因为 A 
是单虽的 >• 所以 Ar 必沏足 ./ •的 "倍 •• 即 = 因此， B 的每个特征向«也是 A 的特征向 
«，并且使《对角化的这些特征向 M 所组成的同一个矩阵也使 A 对 角化. 有关这同一个命题 
的其他处理方法，阽习题12和 13. 

9. 对定理 （1.3. 20>的下述另一个证明作详细的论述. （ a ) 痒先.假定 .4, /36 M ,. 且其屮 
至少有一个是非奇 异的. 证明 .4 衫相似 TBA ， 因 Ifti 和的特征多项式 相同. 提 示：若 

/ A 是非奇异的，则 = A UAB ) A . 此时 • aMB >= tr ( BA >. ( b ) 考虑奇异矩阵 A= n () 1和 

^ L 0 0 J 

^ ^ ( ( |]-证明与 / M 不相似， （ H •它们有相同的特征值. （ c > 证明， f ； A . H ^ M n , WiJ A hi 

与 UA 冇相同的特 征值. 包括电特 征值.提示： 考 igF 面的分析论 iit . 对所有允分小的 e >0, 
人三 A + e / fi 非奇 异的； 因而 A , B 与队 相似， t & A , B 与 iM , 有相同的特征多项式.如果我 
们现在令0,取极限不能保证 K •相似性. （ H 其特征多项式仍然扣等.这是 W 为/' 〆 /> = 
det (// —人 B ) 连续地依赖 e . 因此 AH 与 / M 有相同的特征多 项式. Wlfli 有相同的特征值，包 
括雨特 征值. < d >® 后，若 /\6 M 证明，与 / M 有相同的特征值，包括藥特 
征依 • fli 不包括 / M « 有的”一”，个为 0 的特征值（假定等价地， p tt ,(/) = r >,„(/). 
提示：从添加若 f 0 行〉 以及 £ i (添加若干0 列） 作两个新的 nXti 矩阵，利用垴后一个结果, 
把两个新的（经过适当分块的 > 矩阵乘枳与原有的两个乘枳进行 比较. 

10. 利用 （]• 3. 8> iiT 明下述 推广： 设•已知， （1 A , •…， A * 足 A 的互不相同的特征 
值. 对于每个 i = l . 2, •••• 々,假定 Ui ”，.< M 是 A 的相应于特征值 A , 的个 


特征向 M 的无关组.证明,诸集合之并 Ui ". 4" 
一个无 关组.提示： 如果菜个线性绀合 足芩. 比如 


h >u 




°= ESw = LV ，， # 

»’ I ，•丨 »- 1 w 

利用（1.3.8〉证明每个^=0. 

1】.对引理 （1.3. 17) 的下述另一个更具构造性的证明作洋细论述. （ a ) 证明，若 A , 
可交换，则它们有一个公共特征向毋. 提示： 设 j •是 A 的一个特征向址 ， Ar = Ax , 


然后考虑序列 . r , Rr . tfx , 化 j .，•••• 这个序列中一定有一个元素与它前面的元素线性相关， 
取 M 裙前的这种 元素， 如 fj * r ， 所以 S = Span ( j *, / ir ， B z x , — , B k 是 B 的一个不变子空 
间，因 IW 存在某个非零使得 B . v =/ o ^ 但是 = 九? 一沙因而 S 中的每 
个非零向 M 也是 A 的特征向讨. （ h > 苔.7=<.4, , A 2 , …，是一个有限交换族，用归纳法 
证明， 对所有 .4, 有一个公共的特征向 提示： 若尝0是 / \ M .4: 的一个公共特 
征向董 • 像 ( a ) 中那样，考虑序列 V , A m y . Aiy . Aiy , —. ( c ) 若 KZAi ，是一 个没有有限基 
数的交 换族. 注意到在 > 中不可能有多于 Y 个线性无关 矩阵. 选一个极大无关组冉利用 （ b ) 证 
明，这个有限组的公共特征向墩是 >-的所有元素的公共特征 向擞. 
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12. 如果 AsdiagU , ，心 ，…， D 6 有《个互不相同的对角元，用定理 （1. 3. 12 ) 的证 
明思想 证明. 对某个 AB ^ BA . 当且仅当 B 本身是对角矩阵（但不必具有不同的对角 
元). 

13. 假设有”个互不相同的特征值.如果对某个 AB = BA , 证明 B 可对 
角化，且 A 和衫同 时坷对角化. 提示： 如果 A = S A 是对角矩阵，证明 A 与可 
交换，然后利用习题 12. 

14. 把习题13的结果推广到交换族 iCAt , 这个族至少包含一个具有 n 个互不相同的特 
征值的 矩阵. 试将这个结果与假定族的所有成员都是可对角化的定理 （1.3. 19) 作一比较，这是 
一个较强的结果吗？ 

15. 芩虑分块对角矩阵 AsdiagU /,， 々/:，•••， A */,)6 M n , 其中， 1, 6 ,如果*关）， 

则 A , 关 A ,， 且 = 证明，对某个 BeM ,，AB = DA 9 当且仅当 k 阵/3有分块 
对角矩阵形式 B = diag ( B ,， ft , …， H *). 其中 • B , 6 M . ( . j = \. 2. k . 这个结果与习 
题】2 有何关系？ * 

16. 设 A ， B 6 M ,,, 且假定/\或《非 奇异. 如果 AH 可对角化，证明 BA 也 nf 对角化•考 ■ 

i ], 说明，如果 a 和 b 都是奇 异的， 上述结论未必成立 • 

1.4 特 征向量 

迄今为止， d 经若 寸论 r 的特征值，也论了相应的特征向 M . 特征向 tt : 不仅 

A 对角化中起 ifi 要作用，而 1 L 在各种应用中也有它们的用场.为此还要较深入地讨论特征向 
«• 不过先从关于特征值的另一个论断开始. 

1.4.1 论断设那么， （ a ) 与/\有相同的特征值 （重特 征值按重数计 算). ⑻屮的 
特征值是 A 的特征值的 复共轭 （ S 特征值按 承数计算）. 

证明：因为 det (//— A r >= det (// - A ) 7 = det (， J - A ), 所以 / v (/> = A 4 ( r ). 因而 ( a ) 得证.类 
似地， det ( f /- A - ) = det [("— A ). ]- det ("— A )， 由此推知 (，）=0 万. 因而 （ b > 得证.口 

练习如果 t ， yec ” 都是 A 的相应于特征值 A 的特征向 M , 证明和: v 的任一非零线性 
组合也是相应于 A 的特征向 W ：. 由此得出，《于某个特征值 AeW / U 的所有特征向 M 连同零向 
M 组成的集合是 C " 的一个 f 空间. 

练习说明在上述练习中所描述的子空间恰好是 A - AI 的零空间. 

1.4.2 定义设 A 6 M ". 对于给定的 AeWAK 满足人 r = A * r 的所有向的集合称为 A 
的相应于特征值 A 的特 征空间 • 注意 • 这个特征空间的每个非零元索是 A 的相成于 A 的一个特 
征向 M . 

练习证明， A 的相应于特征值 A 的特征空间是不变子空间，但是，反之不成立.证 
明一个 极小的 A •不变子空间（不真包含较低维的非平凡 A - 不变子空间）是单独由 A 的一个特征 
向 M 生 成的.提示： 运用 （1.3. 17>之前的练习. 

如果知道 A 6 M n 的一个特征值，一个计算相应特征向请的方法是解线性方程组 
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(A-Ai)x = 0. 

这个方程组从理论上看是简单的，而实用上未必行之有效.这个方程组的所有解的集合组成特 
征空间. 

14.3 定义的相应于特征值 A 的特征空问的维数称为特征值 A 的几何重數. A 作为特 
征多项式 />*(•) 的零点的重数（至此，已经涉及了 t 数槪 念） 称为特征值 A 的代數重数，一般说 
来，这两个槪念是不 同的. 在述及特征值时，如果不加限制地使用术语重教，邵通常指的是代 
数*数.，我们将采用这个约定. 

应该指出的是 • 几何黽 数正好是相应于某个特征值的线性无关特 征向掛 的最大个数. 

练习证明 • AeiVt 的一个特征值的几何电数不大于，旦坷能小于它的代数重数.如果 
代数迸数至少是丨 • 那么几何《数罕少是 I . 提示： 假定 A 的几何承数是且设姑以 

\ 的相应于义的线性无关特征向 ** 为其前々个列的非奇异矩阵.采用类似于 （1.3. 7) 中所用过 

_ — 

的证法，证明 : s ms 有形式 ^ * , ieM " wiw 得出结沦， a 的 代数承数至少 是々. 

0 : * 

• ■ 

1.4.4 定义如果矩阵•的某个特征值的儿何 S 数严格小于其代数觅数，就称 A 是亏损 
的.如果每个特 ffi 值的 几何® 数都和其代数承数相就称 A 是非亏损的.如果的每 
个特征值恰好冇儿何觅数 1( 不！虑代数 (S 数 鱿称 A ® 非减次的.所有这些槪念都坫经典 
的，它们在某些场合被广泛采用. 

我们指出，一个非减次的、非亏损的矩阵就是一个 ft 有5不相同的特征值的矩阵. 另外， 
矩阵 / V 6 M ” 可对角化，当 M 仅当 / A 是非亏 损的. 这只是虽述（1.3.7)，它突出了每个特征值 
有足够多的相应线性无关特征向蝓的必要性. 


1 . 4.5 例尽宵 A 和/ \ T 冇相同的特征值，但是它们的相应于某个特征值的特征向蛾可能完全 
[58] 不 N . 例如•设 

耶么， A 的相应十特征值2的（一 维） 特征空问由 U j 士成，而 A 1 的相应特 ffi 空间由 

[丄]生成. 

练习验证（1.4.5〉的细节. 

很明显，迄今所阐述的特征值和征向量的理论，可以平行地对左乘以行向 M 来进行阑述. 
诸特征值将会相同，但诸特征向 ft -般 不同（即使考虑到行对应于 列）. 


1 . 4.6 定义非零向 M _ yeCT 称为的相应于 Aea ( A > 左特征向暈 • 是指 

• v . A = Xy *. 

如果有必要明确，就称 (1.1. 3〉中的向量为 右特征向量， 当上下文不要求区别时，就只说特征向 M . 
练习证明，相应于 A6At 的特征值 A 的左特征向 My 是 A •的相应于X的右特征向量， 
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同 时夕是 A 7 的相应于 A 的右特征向 M . 用例子说明，即使对于左特征向 M 和 t 特 
征向量也未必相同. 

从 （0.6.2) 可知，两个向 Mi , )，6 C ” 称为 正交， 是指 ， i = 0. 下面的结果称为 双正交 
原理. 


1.4.7 定理如果 AeMp a A, X ¥=/ i ^ 那么 A 的相应于 // 的仟一左特征向贵与 A 

的相应于 A 的任一右特征向 ft 正交. 


证明： 设:是 A 的相应于户的左特征向量，而是 A 的相应于 A 的右特征向 M, 
用两种方式计算，，九 r: 

y ' Ar = y ' ( A - r ) = X { y ' jt ) 

= if/y * )x ― fiiy ’ x ). 

闲为 A 关/ i， 所以 A.v、=/iy*r 的唯一可能方 式是: y* 1 = 0，即 J 与: y 正交. 口 

练习如果1=八6^，即 AmHermite 矩阵，且 A 有互不相同的特征值，证明存在 A 
的 w 个两两正交的 （心) 特征向 M. 从 （1. 1>节习题8 可知， A 的特征值都是实数. 提示： 因为 
左特征向 M 与右特征向 M 相 N. 应用 （1.4. 7〉. 

在下一获将 矜到， 在上述练习的陈述中，关于互不相同的特征值的假定是不必要的. 

卜面 要指出，特征向 M 在相似下的变换方式是简申•的， IW 特征值当然在相似下不变 • 
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1.4.8 定理设 a ， BeM n . 如果 jec ” 是相应的特征向 «• 且 b 经 s 与 a 相似, 
耶么 Sj •是/\的相应于特征值 A 的特征向 M . 

证明： 如果 B = S II Rr = A * r , 那么 S »/ US >= Aj *, 或 W 为 S 非奇异， 

Jl . r =^0， 所以3了关0， W 而 Sj •是 A 的特征向 M . □ 

练习验证 e — [丨，丨， l] r M 

1 2 3 

A = 3 2 ! 

2 3 1 . 

的特征问 砧. 如果 D = d ia g ( l , 2, 3>,确定 D MD 的一个分址全为正的特征向馕. 

作为卞 节的苽 后…个 结论， 我们指出，可以利用特征向锹得到有关主子矩阵的特征值的结 
果.这个结果为-个 dh 值的 儿何重 数与代数承数之间的不等式提供了又一个证明. 

1.4.9 定理设且已知，乂设々>1是某个正 整数. 考虑 F 列三个命题： 

< a ； A 是儿问 甫数至少为々 的 A 的特 征值. 

( b ) 如炅是 A 的一个主子矩阵 — K 那么 A 是 i 的特征值. 

( c ) A &代数車:数至 少为々 的 A 的特 征值. 

那么， （ W 蕴涵 （ b >, 而 （ b ) 蕴涵 （ c ). 特别是，特征值的代数重数至少等于它的几何敢数. 

证明：假定 （ a ) 成立，且设 iW ” 是 A 的阶数为 // i> w — A 的主子 矩阵. 因为可以运用置 

换相似和 （1.4. 8)，所以不妨假定4出现在 A 的左 t 角. 设 p , •…， h 是 A 的相应于特征值义 
的线性无关特征向 《：. 把 A 和每个 v , 块分成 
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A 6 M „, 


■ 掴 

v , = U， , a, 6 C m * w , 6 C" " , / = I，2 •… ，先 . 

Lw , J 

W 为向 》叫，…， U ；* 是维数为 《 —— D = 々的空间中的々个向 M , 所以它们是相关 
的：因而存在不全为零的纯 M a! ， … ， a* 6C, 使得 ⑴叫 + … =0. 于是 ■yE a|X；1 + …十 

^ v k = \ U ]^ 0 , 其中 《 = 十… + a * W * 关0， fl Av = Xv . 把这个等式写成分块形式便得到 


-=[^ : E ] 七]… m . 


这说明 A 是乂的特征值.这正是 （ b ) 中的结论. 

现在假定 （ b ) 成立，并且想到恒等式 （1.2. 13>,这个恒等式把特征多项式的导数与 
A 的/!个主子矩阵 A , ，…， 的特征多项式 p. A (/> 联系起来.如果 A = l , 那就没有什么可证 
的. 如果々〉1，那么 （ b ) 是说， A 是每一个 A , 的特征值，因而， p v ( A ) = 0, 且 />\( A ) = 0， 如 
果々>2,微分恒等式 （1.2. 13>得 


p\it) = 2 A (/) ， (1. 4. 10) 

i_l 

然后利用 （1.2. 13>,用每个 A , 的诸主子矩阵的特征多项式之和代替等式右边的毎个导数.因 
为 A , 的一个主子矩阵划去了一行和一列，所以它是 A 的阶数为”一2的主子矩阵，把 （ b ) 中的 
假定和悄等式 （1.2. 13) 用到每个 .4 •躭 得到 p '( A )=0. 电 J £ 上述论证便可证明，对 i = 0, 
1，…，々一 1，各阶导数 〆 V 、 A ) 都为零，因 iflU 的代数重数至少为 □ 

习题 

11 D 1. 证明， AeM " 有秩1,当且仅当存存:两个非零向#1, y ec \ 使得 

A = j-v • 

并 R 证明： （ a ) 这个 A 至多有一个（代数重数是1的）非零特 征值； （ d > 这个特征值是 y I ， 
( c :> 和 y 分别是相应于这个特征值的右特征向 M 和左特征向 M . 特征值0的儿何重数是 多少？ 

2. 证明，秩为々的矩阵可以写成 

A = _ r "， y ". + …+，广， 

K •中 ， y . y ^ ec , /= i ， …，々，即 a 为▲个秩丨的矩阵 之和.提示： 求出&个线性无关 
的行和列，然后利用其余的行和列可以用它们来表示的車实. 

3. 假定 TeM " 是上5角矩阵， R 它的互不相同的特征值 / n ，...， L 沿对角线从左上角到 
右下角依次出现.证明，存在 r 的相应于/„的一个右特征向量，它的最后”一/个分谁都是0, 
并且存在 T 的相应于/»的一个左特征向嫩 • 它的前 1_1 个分愤都是 0. 如果匕不是瓦不相同 
的，那乂会怎样呢？ 

4 - 证明 • 在 （1.2. 7 d ) 中所列出的矩阵的（仅有 > 特征值1有儿何重数 i . 描述它相应的特征 

空间. 



特征值、特征向量和相似性 


5. 考虑分块3角矩阵 


•An A ， 
.0 A ” 」’ 


A = 




证明 A 的各特征值 14 A ,, 的各特征值洱加上 A 22 的各特征值（计相 * 特征 值）.如果 -r 6 C 1 ' Si 
的相应于 AeW . An ) 的右特征向坩 • 而: y € Ct 是 A :, 2 的相应于户 6 tr ( A 22 ) 的左特征向贵，证 

明和是 A 的分别相应 f A 的右特征向 At 和相应于户的左特征向 tt . 关 

于 A 的分別相应于 A 和;/的左特征向 M 和 A 特征向 tt ， 你能说些什么？你能把这些结果推广到 
具有仟意多个对角子块的分块-角矩阵吗？ 

6. 如果 A 6 A 1 关于一个几何1数是1的特征值有正分 M 的左特征向 M 和右特征向址证 
明. 除 r 与这些向 tt 差一个倍数的向 tt 以外， A 没有其他分 tt 是非负的特征向 M . 

7. 作这个习题 中. 槪述关于求的员大特征值及其相应的特征向 M 的幂法.我们作 
菜些假定以简化论述 • 旦使分析部分珂以更为明确.假定 A € A ^有互不相同的特征值彳，•…， 
A -， H 恰有一个 H 有 M 大模 〆 A > 的特征值 A ，. 如果 J … ec ” 勻相应于 A ,. 的一个左特征向址不 
正交 • 证明序列 


t Ar u, . 


0.1,2,… 


*3 近于 A 的一个特征向 《• 而诸向域 W 与中的某个给定分飧的请比值趋于; U . 提示: 
不失一般 n . 脱定 a , = i . ii 设 y "，•••• y -’足 •相应于 a ,, …，的线性 x 关的特征向向 
tf J <M> 可以唯一地表示成 

，’ = y " 十… + W ， 

f：l a w ^0. 注意 • 但盖一个比例 H 子.因为 U I <】• U I *— 0. 

/=丨•…，"一 1，从而这个和趋干 y - 1 的一个倍数. 

«• 用¥法还可以计算其他的特征悄（和特征向《>,不过浴借助一个桥梁，称之为压缩， 
它给出•个阶数比 AGM ,. 少丨的方阵 • 其特征偵是 . A 余 F 來的特征值.设夂和/〜足（用栎法 
或其他方法算 出的〉 A 的特征值和特征向 Ih ft 设 SeM ” 是第1列为>^>的非奇异矩阵.采用 
习题7中的记号，证明 


S 'AS = 


" A , ： ^1 
-0 AtJ 


ILA 6 At ., 的特征 tfifiA , •…， 夂，.从 A HJ 以算出另外的持征 值. 然后欺复施行 ; K 缩，如 
此等等. 

9. 设 ACM ., 有特征值夂 • •••• A R , • ()• Wjfll rank 冉假定的最后一行是其 

余各行的线性组合. ( a > 如果把 A 块分成 


其中 /VuGiK :,证明.存汴向 tt & C ” \使得 
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dll = A r A U 和 = 12 - 

试用 A 的相应于 0 的左特征值来 解释& ( b > 再证明 A n + a , 2 6 T eM „ ,有特征值幻， •"• A 
提示： 考虑 A 的经 



的相似矩阵.应指出的是，因为具有余下来的特征值的低阶矩阵是可以给出的，这便是/ II 缩的另 
一种形式.如果知道 A 的一个特征值 A , 那么，本习题所描述的过程可以位用于尸 (A — ADP 1 ， 
其中 P 是适当的置换矩阵. 

10 . 设 Te / vt 是非奇异矩阵 • 它的各列是的左特征向量.证明（: r 厂 1 的各列是 a 
的右特征向 M . 



第 2 章酉等价和正规矩阵 


下面，要研究一种特殊类型的 相似. 它跟矩阵分析的许多应用冇密切关系. 


2.0 导引 

对一般的非奇异矩阵 . S 6 R . 汴第一擧中初步研究了经 S 的相似问题.对于某些很特殊 
的非奇异矩阵 S ， 称之为丙矩阵，它的逆有简单的 形式 ： S '= S -. A 6 A 1 经一个西矩阵的相 
似， A - S * AS , 不仅理沦上比一般相似更简单 （ S •要比容易计算得 多）， R 有许多优点， 
这咚优点通过以后的叙述会变得更加明 大致说来. 两相似优 f 一般的相似，因而 • 了解通 
过两相似所获得的性质足很 fl 川的. ft 内相似 F 的等价类比 在-般 的相似下的等价类更 
细（两个矩阵可以相似 • 似不两相似）. W 而，相应地所能得到的每个等价类也较小.在第3$ 
中还要逬一步研究一般的相似. 

假定 . S 是作夺样矩 w , m 不一定足 两矩 阵，那么，变换 AS 称为•相合， 
这将作第4 改加 以研究 . 这个变换也坫 I •.的一个等价关系，且冇 i 午多（与相似不间的）特 
点. fi 要的是 要意识 到.通过 两矩阵的扣 似既相似， 也是 •相合，并 R 是兼有相似性质弓相 
合性质的®广泛的变换类. 

2 . 1 酉矩阵 

2.1.1 定义我们知 itt , 向 Wa •…， AfC ： •构成一个正交组， 拈指对 所有的向饋偶有， 
^•^=0- \^ i < j < k . 此外，如果诸向置还是正规化的， = 1=1, -• k 9 那么该向 
tt 组称为标准正交组. 

练习如果{. V ,,… • 力>是由非零 向嫩组 成的正交组，证明由1 = ,= 

!,•••, A 定义的向 M 组 ，…，心丨 是一个标准正交组. 

2.1.2 定理标准正交向 M 组线性无关. 

证明： 假定 ： U 是标准正交绀 • 且 0 = a|J| + M + a j 4 . 于是， 因为渚 向镦 X , 

k 

是正交 的.所以 0 = ( T 0= ^ a . a f s ： j , - U , : 乂诸向 a •，是 IF 规化的，所冇 

## — I 

k k 

S k IW , = 乂 U I 2 -0. ㈥ 此，所有 a ,=0, 故彳，…，是线性无关组. 

i - I i=l 

练习证明非零向 tt 组成的正交组线性无关. 

练习证明，如果 a , ，…， j *6 C * 是正交组.那么，或者々<7;，或者诸向量^ .，中 至少有 
A 个等于零. • 

4然，一个无关组未必是正交组，不过，可以把 Gram Schmidt 标准正交化过程 （0.64) 应 
用于该无关组，从而得到一个标准正 交组. 它也生成原向 M 组. 

练习证明仟意々维实 的或复 的向墩空问有一个标 准正交 基（一个由标准正交组组成的 



基). 

2.1.3 定义设矩阵 L / eM ,， 若 U.U=I, 就称 a 为酉矩阵.若还有 L /6 A ^( R ), 就称 （； 是 
实正交矩阵. 

K 中的两矩阵构成一个倌得注意的®要集合.在 （2. 1.4) 中列出了关于是西矩阵的几 
个基本等价条件. 

练习若是非夺异矩阵， SBeAl 使凡4 = /,证明， （ a >/ i 是唯一的， （ b ) Ai >/. 
自然，记 B = A ' 提示： 非奇异性推出，对任意给定的方程义1 = 7和 a * M = ，有唯 
QI ] -解. （逐列）证明 = ; 和 （逐行）证明汉 7\ = / 有唯一解 &.• B , eM n 9 于是，用两种方式 
计算 u , ab h 便可证明 b l = b h . 


2.1.4 定理如果 L /€ A ^， 那么下列条件等价： 

( a ) U 是酉 矩阵； 

a ) u 是 非奇异 矩阵， at ;* l ； 

( c ) uir =i: 

( d ) IT 是酉 矩阵； 

( e ) U 的各列组成一个标准正交组 i 
< f ) U 的各行组成一个标准正交组； 

< K > 如果』 €-( T 旦: yB ( i . r ， 那么，： y 的 Kudid 长® 与 .1 •的相 间： 即 = 

证明： 条件 Uh 屯涵条件…}，这坫因为 ， U •]& 唯一的（只要它 在〉， RL 7 左乘以它就得 
I ; W 矩阵的定义保 iltU •就是这样的矩阵. W 为 = 当 ft 仅当 = 对于 A , 

所以 （ b ) 殖涵 （ c ). W 为 （ U . r = L 7, ( c > 推出 L /. 适合西矩阵所必炻的条件；即涵 （ d >. 由 
于上述每个推理都可类似地反推 M 去，所以〜（<1 )足等价的. 

根据矩阵乘法的技巧，且设 V 表示 - L ； 的第 i 列，，=1 ， "•• „• 条件 LTC /= 丨的意思是说 

«“•••、丨0 •如果） 关“ 


1* 


如果_/ 


W 此， tr 【/= i 的另一种解释是， " 的各列是标准正交组，与 （ e ) 等价.同理 （ d > 与 （ f ) 
等价. 

如果 （ a > 成立 • 江夕=【/义， m . v\v = . r - L /- L /. r = u - - 涵 （ g >， 另一力•面， 

为厂验证逆命题成立.滿要作稍傚复杂的 计算.不过. 本 B 后而要给出的方法将使这种计算更 


为卉 接. tf 先考虑"= 2的情形，假定⑻成立 • 并且设 《 r = j ^. 我们得知，1 =), •尸 

= 的1，1 元. 类 似地. 设1=0得出 LTU 的 2. 2元也是 1. 因 IWU . L 7 必 


•，(_/•仏的1， 
须有形状 
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其中， u 是 L/ 的第I列与第2列的内枳，肘 J 是第2列与第1列的内积.在 （g) 中设 

然后再作计算，因而得知， 2 = = ^ = V Ux = 2 + ( u + a ). 设得知2 = 2十 

i(a — a ). 因此，“十 J = 2Ke« = 0， 且 a—J = 2ilma = 0， 从而 “ = 0. 这就是说，如果对所有 J.6 
x-VUx = xx 9 那么 LTL； = 1 ; 即 L； 是西矩阵（如果 l；€M 2 ). 现在考虑 n>2 的情形，且 
设 A = trt /. 假定是这样一个向 M . 除 r 第/个和第 y 个分 M 以外，/<)，它的所有分 
M 都是 0. 于是 

•r.Ar = [j\ ， ;/1 八 ({ ， • ， )}) 夂 • 

Lj^ J 

[见 （0.7. 丨）关于子矩阵的记号 ],w 此，刚才项明 r(g ) 蘊涵 = 因为，和> 

的任意性，得知 A 的每个 2 X2 主子矩阵郫 z 2X 2 单位 矩阵. 正是这个 A = 乂因 

为 的情 形是显然的， W 此得出 （S; 藿场 U ), 证毕. □ 

2.1.5 定义一•个线性变换： T : C ••〜 C ” 称为 Euclid 等距变换，是指对 所有* r 6 C ”， 有 1 > = 
( Tjr)'(Tu ). 定理 <2.1.4> i ? : 位，一个〔4方阵以€ 是一个（经由 "：的〉 Eudid 等距 
变换当且仅当 L / 是两矩阵.毛于 K 他形式的弩阼女按见 5. 2节. 

练习设 

Tw = |. 

L_ sin 汉 ⑺必」 

其中0是一个实 参数. U> 如* U6M 2 <R>, 证明， C； 是实正交矩阵，当 R 仅当 【/=T( 仍或 
对某个没 6R 成 i. (1))611# L；6M ? (R ), 证明 ， U 是丈正交矩阵，当且仅当以=了(0或 

ro 11 

oH 

对某个 成立. 我们用一个参数 0 给出了 2X2 实正交矩阵的两种不同的表示 形式. 试从儿 
何上解释它们. 

2.1.6 论断如果 C；，V6M , 是 FS (相应地，实正交）矩阵，那么，乘积 C/V 也是两（相应地， 
实正交）矩阵. 

练习利用 （2. 1.4> 的 （b> 证明 （2. 1.6). 

练习如果 U ,， ^ •…，是标准正交组 • aL/6Al 是酉矩阵，证明 {ar,， …， 
【Ard 是标准正交组. 

2.1.7 论断/ V/"中的两（相应地，实正交 > 矩阵的集合构成一 个群. 一般称这个群为„ 〆 ”酉 
( 相应地，正交）群，它是 GUw， 的一个子群「见（0.5> 节]. 

练习我们知道，一个群是这样一个集合.它在一个结合的二元运算（“乘 法”） 下是封闭 
的， IL 使得关干这个运算的单 位元和 逆仍在该集合 中验. 证 （2.1.7>. 提示： 用 （2. 1.6) 验证封 





闭性；矩阵乘法是结 合的； 是酉 矩阵； 且 = l ； q 也是酉矩阵. 

M ,. 中的丙矩阵的集合（群）有另外一些很承要的性质.一个矩阵序列的“收敛性”槪念和“极 
限”的概念将在第$明确地拾出，不过，这里珂以从每个/， ） 元的“收敛性”和极限的观点来 
理解这些槪念.定义恒等式 ir 【/=/ 意味着 L 7 的每个列有 Euclid 长度】，因而1；=[【人]没有 

—个元 C /,, 的绝对值比1 大. 如果把两矩阵的集合看作 C w 的一个 子集，这说明它是一个有界子 
集.如果【人三[<，]是一个两矩阵序列 • 2. 使得所有/, _/ = 1，2, …，… lim ^^ 

存在，那么由恒等式 WA = /. 々 = 1, 2 ，…， 我们看到 li m LV 【人 = a:【/ u = /, 其中 

I • • 

【九三 [<”]. 闪此，极限矩阵认,也 ft 酉矩阵.这就是说.丙矩阵的集合是 C 11 的一个闭 子集. 

ft ! 于有限维 Euclid 空 M 的一个有界闭子集是紧集（见附录 Eh 由此可知， H , 中的两矩阵 
集合<群>是 紧的. 眼下 • 这个结论的 M ® 要的推沦是下述右于 两矩阵 的选择原理. 

2.1.8 引理设 U ,. U ? , …娃中的已知的西矩阵序列.则存在一个子序列 U k . : ，… 
使抖当 /- oo 时， L /* 的拇个元（作为复数列>收敛于一个西矩阵 K 的对应元. ^ _ 

证明：这里只 耍求我们.总酊以从一个紧集的任一无限序列中选出一个收敛子序列.我们 
L 1 经知逍，如果一个两矩阵序列收敛于莱•个矩阵，那么其极限矩阵一定是两 W 阵. □ 

rtj 引理所确定的两极限不一定 S 唯一的：它可能与 r 序列的选抒有关. 

练习考虑两矩阵 JT 列 . 

rf ro iv 

U t = I • k = 1,2.-. 

Li OJ 

证明它坷以有两个子序列极阳 . 

练习选择原理（2. 1.8>也适应于正 交群； 即，一个实正交矩阡序列有一个收敛于实正交 
矩阵的 f •庁 •列. ft 实的怡形.试通过复述同祥的推理验证这个结沦. 

两群的紧性在本书的 K ： •他地方要用到它. 

—个两矩阵有'等于 U •的 性质. 一种推广曲矩阵 的槪念 的方式 M 要求 L 7— 相似于 LT . 
容易矜出，对所冇祁奇#珩阵 AeAt , 这些矩阵的集合可以刻划为映射小的值域. 

2.1.9 定理设是非奇异矩阵.那么 • A 1 相似 f . V , 当且仅当存在非舒异矩阵 
M ". 使得 A = B l B \ 

证明： 对于某个非奇异矩阵 M ". 如果有 A = « ，《•, 那么， A 1 =(/r )-' B , 并且 
/ r /\) ' = B(/r ) •— (b : /r r = a - ，这样 • a 1 可经相似矩阵 ir 相似于 a 、 反过 
来，如果 A 1 相似于/ V ,耶么，存在非奇异矩阵 使得 SA ! = A \ 对&尺 ，令 
s 卢 〆 0 S ， a 注意到 ' S , '=^ S /\ •(e >fi S l ) = SA ^ S ~ l = A \ 另一方面， S , = A * S ^, 
旦九相加这两个恒等式便得到 H, = .V 其中， H,^S,+ S ； 是 Hermite 矩 

阵. 如果仏是奇异矩阵，那么，存在某个非零 leCT , 使得 0= H # = S # + S ,. o •，因 
而， = = ^ ' S >, HS - l Sx =~ e 2 te s . 选取值泛=乳6[0, 2 tt ], 使 不是 

s ' s . 的特征值；所得到的 Hermite* 矩阵是非夺异矩阵，且有性质 H-A' HA . 

现选取任一复数 a . 使丨 £ t |=1, 且 a 不是 A •的特征值.令 B )// ,其中 
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复参数 /?_ o 是有待选定的，不难#出， g 是非§异 矩阵. 为了使 A = 或 /m = /t • 

经计算 ， /r = H (/5 fl /-^ A ), 而 — A . > — A . HA ) H ) = 

IHa ^ A - pl ). 如果能选定--个非零沒使 /?=_ 知，就完成 r 证明，而当《 =，时，只要取0= 
就 行了. □ 

习题 

1. 如果是两矩阵，证明丨 det U 丨 =1. 

2. 如果 AedLO , 而是西矩阵，证明 U 1=1. 提示： 利用等矩性质 （2. 1.4 K >. 

3. 给定实参数化 • 於，…，艮 • 证明 

V = diag( ^ ， 〆•’ ， ••• ， 〆 •） 

是两矩阵. 

4. 说明实对角正交矩阵的特征. 

5. 证明 K 中的置换矩阵 (0.9.5) 是正交矩阵，并证明置换矩阵构成实正交矩阵群的一个 
子群（这个子災本身足一个群 h fr： M . 中冇多少不同的 ffl 换 Si 阵？ 

6. 你能给出 3X3 正交群的一种参数表示形式吗?想一想本节中给出的 2X2 正交群的两 
种衷示形式. 

7. 对定理 （2. 1.4) 中条件 (g)a 涵条件 （a> 的 F 述另一个证明作详细的论述.证明 （g> 表示 
对所有 jeer 有 ， 0/_1/-/^ =0. 设 H=LT【/ 一 /并且注意到 H = H _. 考虑 0 = (1 + 
〆>*>• //(.r + ， .v), 对所冇 h .v6CT 和所行沒 eR. 展汗这个等式并证明对所釘 *r, vec w 
.! • //v = 0. 系统地选取 j •和 .V 可得出 H=0. 

8. 适合 AAT =/ 的珩阵. 4€ ^^称为正交 W 阵. 一 t 实正交矩阵是两矩阵， 但一个 非实正 
交矩 阵不一定是丙矩阵 .（a> 设 

ron 

K = e M^(R). 

L 一 1 0」 

ill; 明，对所有 /6R， 八(/)’（0^/>/ + (/—1^>尺6从是正交矩阵，但只有/ = 0时 A(/) 才是 
两矩阵.其中，双曲函数定义为 cosh/ = '>/2, sinh r = (^-e ')/ 2 . ( b > 证明，与两矩 

阵 + M 的适， SiE 交 S •:阵的铌合不 M 有界集， WrM 它不诘紧集. （ c ) W •明，跟西矩阵一样 ，一 
个给 定阶数的所有 H 正交矩阵的集合构成•个群.尽管如此，通常的做法是，正交群这一术 i/i 
专指一个由给定阶数的所有实正交矩阵组成的较小的（紧）群. （ d ) 矜是 iH 交矩阵，址明， 

I (let A 丨=1，但可能有特征值 A 适合4丨 #1. 提示： 考虑 U> 中的 A(r>， 证明 | A(/) | 可以 
任意大. （e) 若 AeAt 是正交矩阵，证明 A. A 1 和 A •都是正交矩阵且 A 是非奇 异的. /\的 
诸行或诸列构成正交组吗？ <f> 说明对角正交矩阵的特征 . 与习题4比较.为®免混淆，有的 
作荇称不一定是实矩阵的正交矩阵为复正交矩阵 • 但是在文献中一般不明确这种 区别； 术语正 
交矩阵有时是指我们所称的实正交矩阵. . 

9. 如果是酉 矩阵. 证明 t；, L； 7 和 U •都是两矩阵. 

10. 如果 ueiw n 是酉矩阵，证明 • I ，： yec " 正交，当且仅当 Lb 与正交. 

11. 称非奇沣矩阵是斜正交矩阵，是指 A '=-.4 r . 证明， A 是斜正交矩阵，当 
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R 仪巧士 /A 是正交 矩阵. 更一般地，如果 /9GR， 证明， A 当且仅当〆 <2 A 是正交 

矩阵.当 时. 它是什么？如果0=0呢？ 

12. 证明，如果相似于一个酉矩阵， fl 卩么 A — 1 相似于 A' 

13. 考虑矩阵 A = diag(2. \) eM 2 . 证明相似 f 两矩阵的所有矩阵的集合是其逆 A 1 相 
似于 .4' 的所有矩阵 .4 的集合的一个真子集. 

14. 证明 M B 中的丙矩阵群与 Ah 中的 复正交 矩阵群之交是的实正交群. 提示： 考虑 

= A + 其中 [；• A , B 6 M ., 且是实矩阵.如果 L/ 既是西 矩阵， 乂是复正交矩阵， 

证明 B 7 B =0. 从 | fjj . 对每个标准基向 ( Be ,) T ( Be ,)= 0 , 因此 li 的每个列都是 0. 

进一 步阅读 想了解关于适合定理 <2. 1.9>的条件的推广的西矩阵的更多信息，可参看 C. 
R. DePrima nnd C*. R. Johnson. “ The Range of A 1 A' in GL ( n, C) Linear Algebra 
Appl. 9(1974), 209-222. 

2.2 酉等价 

W 为丙矩阵 U 有 LT =C/ 、 所以. 加果 （； 是丙矩阵，那么由 A—[；• At； 给出的 M 上的 
变换是相似变换.这种特殊的相似形式称为丙相似或 R 等价. 

2.2 •丨定义设矩阵 A . 如果存4:丙矩阵 CyeM ”， 使得 B = LTAL /， 就 称朽酉 等价于 

[ J 2 j 如果 I ；可以取实矩阵（因 Ifii 趄实正交矩阵）.那么就称 ZK 实）正交等价于九 

练习 证明 PI 等价 fi —个等价义系. 

2.2.2 定理如果 A = [«:,] 和 B — 西等价，那么 

S I 〜 I: = S U 「••• 

• I | •广 I 

证明： 作矩阵乘法后便可？5•出 丨心 I 2 = tr /A- A. W 此只要验证 tr/T G=tr ( A 就够 

了.如果 B =【rAL/， 则 W 为迹 M 相似不变 M， 就有 tr/r B=trC7* A_ 【几 r AC/= tr LT AML/= 
tr .A* A. □ 

练习 定押 （2. 2.2) 说明 tr/T.4 是两相似不变 M. 不用 t A 还可以作出另一个证明，不 
过要利用上一节的 结果： 用一个西矩阵乘一个向 M 不会改变其 Euclid 长度，要注意的是，从 
左做起的矩阵乘法是乘被乘矩阵的各列 • 而从右做起的矩阵乘法是乘被乘矩阵的各行. 

练习 证明 


3 n 

— 1 r 

和 


L 一 2 0」 

-0 2. 


相似 • 但不西等价. 

因为两等价蕴涵相似 • 但是反之不成立，所以，与相似等价关系相比，酉等价关系把 M n 
划分成更细的等 价类. 跟相似 一样. 西等价对应一个基变换，不过它是一种特殊形式的基变 

换-它把一个标准正交基变成另一个标准正交基.基的标准正交变换不改变向 量的各 分量的 

绝对值的平力和，而 这个贵 在基的一个非标准正交变换下是可以改 变的. 因为求共轭转罝要比 
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计箅逆容易得多， 所以在 计算上 • 丙等价 X 系要比相似关系更简单.在出现舍入误差的情况 
下，它也能较好地保证精确件，因此，在数值计算中，它是可取的.关于这方面的细致理由就不 
在这室阐述了，但是，可以作一个直观的解释，那就是用一个西矩阵做乘法有保持长度的性质. 

下述两种特殊的（乂很简 单的〉两矩 阵形式给出两种西等价变换 • 它们在特征值的计算中非 [TJ 
常®要. 

2.2.3 例： 平面旋转设 

r : : 

: 0 : 


. gos 0 0 … 0 — sin 0 .. / fj 

0 1 

inoxi.j) ^ 0 : : 0 

0 0 ! 

. sin 0 0 ••• 0 cos 0 . j 


L 

/ 列 ） 列 

它相当于一个单位矩阵，只足它的/元和） • ）元代之以 cos ^ Ifii /, )元（相应地），/元） 

用一 sin 汛相应地 sin 仍来代替. 

练€对于任一对指标和仟一 ft 参数验证 /• j ) & 

的正交矩阵 Ud /• 乃只是仵/， ） 坐标平面中作一个 (<? 角的） 旋转. 值得指出的是，左 
乘以 L / d : f . 仅刈被乘巧阵的/行和）行科影响，而右乘以 L；(A _/) 仅对/列和列有影 
响，因此. 冷 i 、 ./) 的丙等价只使 i ,) 行和“）列有变 化. 经平面旋转的西等价是计算 
特征值的 Jacobi 法和 Givens 法的基本特征. 

2 .2.4例 HousehoMw 变换.设 wfCM •非零向讨，定义 K 6 M ,, 为= / — /⑽， • ，其中 
t = 2( u ' XV) \ 注意， U-U-' 6 M W , 而 tf*u ， 是 一， t * 正纯 tt . 如果 w 已正规化 （《；• u ;=】）， 那 
么./就就是/一2 胃，_.我们常常是在假定 u ； 已经正规化的前提下给出矩阵 【/ u . 

练习 V '明，在补子空间^上相当于一个单位变换，而在由 ic . 生成的一维子空间上 
相当于一个反射：即，如果 1 丄加，则 U u i = j ， 而 L ^ VV =_ W . [- 74 ] 

练习证明，既是西矩阵，也是 Hermite 矩阵 （ LM . = L / tt ). 形如的矩阵称为 
Householder 变换.经【人的西等价有时也叫做 Householder 变换.这些变换在本书中要多次 
出现，其中包括计算特征值的 Householdei •法（见习题 ‘1) 以及其他两简化方法.值得指出的是， 
Householdei •变换一般变更它们所作用的矩阵或向鲎的所有元索 • 但是 • 它们为许多应用提供 
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非常有效而精确的简化. 

定理; 2. 2.2) 给出了两个已知矩阵酉等价的一个必要而不充分的条件.我们能在此基础上 
冉添加更多的恒等式，这些恒等式共同给出两个已知矩阵酉等价的必要充分条件.其中，下述 
简单概念起着关键的作用.设/是两个给定的非交换变元，称5, /的非负幣数幂&仟一有 
限形式乘枳 

W (.%,/) — s'* ,、’ /”：•••>、/、• //?, */1, ，…， "/* > 0 (2. 2. 5) 

为关于.、和/的字.字 W (5, />的次教是非负整数， / I , +Wi + w 2 +… +// i t ，即字中的所 
办指数之和.如果已知 A 6 M ,， 我们 n 〖以形式地定义 A 和 A •的字为 

W (.4 ，.V > = A M ' iA ' >'4'、 A . 

由于 A 与 A •的： N ； 未必交换，试阁®排乘积中的项来简化/不一定可行. 

如果 .4 阿等 价于某个那么，对莱个丙矩阵 A = UBU' . 旦不难箅出 
W(A.A' )= (UBU 9 ) mi a)H 9 ir )-< •••(L/fiir ) m *aJH'\J' ) M * 

=uir u-iH iv )">U' — L//r*L/* (；(/r mr 
= UB^ur .../ r *(/ i * r*w 
= uwuuh- )(；*. 

WlW，tr W(.4, .A* )--tr IJW(H, H' )U' «• > 如采取字 VV (.、，，/)=/.<, 就得到定理 

(2. 2. 2) 中的 W 艿式 . 

对所介可能的字 W (.、. />• h 述结果 给出广 两个矩 阵是两 等价的尤限多个必要条忡.下 
而，我们+ 加证明 地叙述 W • Specht 的-个定理 • 这个定理确认这无限多个必要条件 M 时也 
适允分条件. 

2. 2.6 定理两个已知矩阵，\, KeR 两等价，当且仅与 

tr W(A,A- ) = ir WUi,B m ) (2. 2. 7) 

对于两个非交换元的每个字 VV ( x , M 都成立. 

參 

Specht 定理只能用来证明两个已知矩阵不丙 等价. 然而.除非在一些特殊情形 （见习 题 • 
它在 证明两个已知矩阵是 沔等价 时可能大效， W 为必须验证 X 限多个 条件. 幸运的是，冇 
一个定理对 Specht 定理作了改进 • 它诚于 (；• Pearcy . 这个定理说明， R 要对冇限多个字验证 
迹恒等式 （2. 2. 7) 就 够了. 

2.2.8 定理两个 LL 知矩阵 A ， 1^6 M , 內 等价，当且仅3 tr W ( A 9 A ' ) = tr W ( B , > 对次 
数至多是 2/ r ’ 的每个字 VVU , /) 都成立 • 

Pearcy 定理中的有限限制是对 Specht 定理的一大改进， f 曰•是，如我们所知，这还是非常 
保守的.肖，/ = 2时，只要对 三个字 W (.、， 一 A ， /和/.、•验证迹恒等式就够了.无需考虑次数 
至多是2(2> 2 = 8的所 有字. 当，! = 3时，只要对9个字 VV ( S ，/) = s , 5 2 , /. s , . s 3 , /. v 2 , / 2 /, 
/.、/.、•，// /. 、•和 验证迹恒等式而用不着考察次数至多是2(3) 2 = 18的所 有字. 
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习题 

1. 设 AsUdeiVUR ) 是对称矩阵 （ A T = A >, 但非对角矩阵，并假定选下标，»使得 
1% I 越大 越好. 用 ( a —〜>/2“ v = cm (2 仍定义沒， ft 设⑺力/, )> 是如（2.2.3>中所得到的平面 

旋转. 用 （2. 2. 2) 证明，如果 /, j )\\ U (0； i , j ) = ( b IJ ), 那么 [ | ~ | 2 < E 1% I 2 • 

，參 i 

说明累次应用这样的 T 面旋转（用上述相同的方式对 《 和它后面的矩阵作相应的选择）会缩小 
各非对角元的平方和而保持所有元的乎方和不变：每做一步.所得到的矩阵就比前一步更接近 
于对角矩阵.这就是计算一个实对称矩阵的特征值的 Jacobi 法.这个方法产生一个实对角矩阵 
的矩阵序列.为什么极限矩阵的诸对角元必定是 A 的诸特 征值？ 

2. 关于实对称矩阵（或一般的实矩阵）特征值的 Givens 法也是利用甲闹旋转， 似采 用的方 

式有所不同.证明，一个对称矩阵 A = 经若干平面旋转后正交等价于一个三对角 

(对 称〉 矩阵，而一般的 AeAt ( R 〉 经若干平面旋转正交等价于一个（卩） Heisenberg 矩阵.关 

于5对角矩阵和 Hcsscnberg 矩阵可阽（0.9.9)和 （0.9. 10). 提示： 选一个平面旋转1；,. 3 使得 圆 
的丨，3元为 0. 选另一个平面旋转使 I , 4元为0,继续做下去直到1, ri 元.然后转 
到2, 4 元， 接苕做 F 去. 注意，这样一步步做下去不会影响前面已经选定的0 元； 并且正交 
等价保持对称件不变.一个三对角矩阵的特征多项式是容易确定的，而其特征倌可用求根的方 
法来确定.注意到经过有限多次平•面旋转后 Givens 法得到一个三对角矩阵，但它不会显现特 
征值或特征向嫩 • 不过利用另外的汁 W — 定能得到它们. Jacobi 法一般不会经有限多次平面旋 
转后中止.似它的 FI 标是产生一个对角矩阵， rftilL 得到一个标准正交特征向 M 组. 

3. 证明，拇 个乐阵 R 等价十…个有相 M 主对角元的矩阵. 提示： （ a )^ AeM :， 

考併 A — （ l /2 )(tr A >/， id : 明只黹 考虑 trA = 0 的情形就 行了. 若 * r 6 C 2 是一个使 ， Ar — 0的 
申位向《，设是一个两 矩阵， 说明 LTAU 的1, 1元为零，并 H . 利用迹条件 
证明 K :2, 2元也为芩.为了求这个向 M . r , 设 ir , z 是14于 A 的两个特征值士 A 的特征向 S . 

如果 A = 0, 取 j = u ，. 如果 A 关0,设 + iiH 明，对所有 有 * r (^ 浐0，而对某 
个 有 Ai (们=0,对这个沒， & s = x { e )/ lx (0)- x (0) y n . 如果 AeAi 2 ( R >, 容易 
构造一个 （实〉 平面旋转口 =【八0; 1. 2>使 L / W / 的对角元相等，但这在 g 的情形 fi 行不通的. 

定义 /( A > 二 max { |〜一《" | : /，）= 1，2,…，/!}，并且设 「〜 其中指杯偶“ ） 

适合 /( A >— u „— % I . 设足使 U / A 2 K 有相间主对角元的两矩阵.如同 （2.2.3) 中 
从 2 X 2 平面旋转构造 U (义/, )>, 用同样的方式从〖心构造 U (/, >)6 M W , 并旦证明，如果极 
大对角元之差不是多个可取差，则 /( U ( y ， j )- AUU . >))</( A )； 否则可以重复上述构造. 

可以断定，如果 /( A ) 关0,则有两矩阵使 /(LT AL 0</( A ). 设 RM ) eU 7*/ U / : 

卩是酉矩阵},证明 R ( A ) 是紧集并•注意/是尺 （ A ) 上的连续函数.设（:6尺 ( A ) 适合 /( C ) 
- min {/( B )： B 6 K ( A )}, 证明 /( C ) 不成立，因而从 /( C ) =0得出结论 成立. 

4. 证明，用 Householder 变换可以把一个具有 Euclid 长度/的任一向量 《reR 

变成长度为 r 的任一其他向 y 关 x . 提示： 试用证明，其中切=1_ > 如果： r ， 
y ^ C n 你能得出什么结论？ [77] 


5. 计算 A 6 A 1( R ) 的特征值的 Householder 法如同 Givens 法，先把 A 化简成（上） 
He . ssenherg 矩阵（或在对称的悄形化为三对角矩 阵）. 构造性地证明 • 其第 j 列中的第 （j + 1 >个 
元素以后均为 0()=1, …， H 的形如 


々行 

(走+ 1>行 


的矩阵，经一个用 Householdei ■变换所确定的实正交相似可以变成一个同形的矩阵.由此得 
出，任一个矩阵都可以经一系列 （w — 2个） Householder 相似化简成上 Hessenberg 
矩阵，而一个对称矩阵 WJR ) 可用同样的方式化简成三对角矩阵. 提示： 对于第（纟+ 1> 
列，选一 Householder ■变换 * 把出* 在对角线下方的诸元索组成的 — H 维向 址 变成 
[1，0,…，的一 个适当 倍数.于是经由正交矩阵 

口 ^ 

确定的相似可变 换粮个 矩阵，并旰石蚰所想要的0子块出现了. 

6. 设和•是给定的.用5卩代以定理（2.26>或？卽0^定理（2.2.8)证明朽 
与 C 西等价，3且仅3 e 列《汆件下的任-个成立： 


(a) 

'A 01 [A 
■o 」和 L 

: 丄 ] ft 等价 . 



' H 

0 • 

C 

0 

(b) 

B 

• 

• 

• 


和 C . 

• 

• 



_ 0 

B 

0 

c. 


"A 

o - 


0 _ 

(c) 

B 

• 

• 

參 


和 c • 

• 

• 



• 0 

B _ 

0 

»c . 


两等价 • 其中两个贞和冇相同的项数. 


两等价，其中两个直和有相同的项数. 


7. 证明，诸某个次数々有2*— 1 个不同的形如 （2.2.5) 的字/)，因而得出至多有4« 2 
个次数至多为 2 n 2 的不同的字. 

8. 试给出两个 2 X 2 矩阵，这两个矩阵满足恒等式（2.2.2)，但它们不两 等价. 解释其 
原因. 
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进一步阅读与注释关于定理（2.2.6> 的原始证明可参看 W . Specht , "Zur Theorie der 
Malrizen II , y ' Jahrtsbericht der Deutschen Mathematiker Vereinigung 50(1940) , 19-23. 定理 
(2. 2. 8) 的证 明可见 C . Pearcy , ** A Complete Set of Unitary Invariants for Operators 
Generating Finite W ' - Algebras of Type \/ y PacificJ . Math . 12(1962) * 1405-1416. 关于低 
阶矩阵丙等价的讨论可见 C . Pearcy，“A Complete Set of Unitary Invariants for 3 X 3 Complex 
Mat rices • Trans . Amer . Math . So (. 104( 1962) * 425-429. 

2.3 Schur 酉三角化定理 


初等矩阵理论最有用的基本車实或许是任一矩阵西等价于一个上三角矩阵: T [也两 
等价于一下三角矩 阵]. 了的诸对角元 A 然是 A 的特 征值. 尽管这种形式不唯一，但是它是在 
丙等价下所能得到的最简形式. 

2.3.1 定理 （ SchmO 已知有特征值 A ,， …，它们按任意规定的次序排列，那么存 
在一个 两轵阵 使得 

VAU = T =[/,] 

是具有对角元 /„= A ,， /=1 •…，”的上三角矩阵，即每个方阵 A 两等价于其对角元依次是 A 
的特征值的三角 矩阵. 此外，如果 AeMJR〉， 且 A 的所冇特征值都是实数，那么，可选择 L ； 
为实正交矩阵. 

证明： 证明本身就是实施一系列相 N 形式的化简算法并得到化简结果.设/"是 A 的相应 
千征特佰 A , 的正规化特征向 W . 非零 向撖/ "可以扩允为 C •的一个基 

砬用 Grain Sclunidt 标准正交化过程 （0. 6. 4>于这个基，便得到 CT 的一个标准正交基 

从左至右把这些标准正交向 M 排成 fl 矩阵 CA 的 诸列. W 为的第丨列是 A ^", 计算 表明. 
U ； ( A 【 p 冇形式 


矩阵，有特征值々，…， A ”. 设 *r … 6 C ” 1 是的相应于 A 2 的正规化特征向姑，然后 
完全 I 复上述步骤.确定一个酉矩，，使得 


U { A t U 2 




并设 


V z = 



f 是，矩阵和是西矩阵，因而有形式 



Gl 1 




继续作这种化简便到两矩阵 /=〗，•••， /I — 1 和 丙矩阵/ = 2，…， 77-1. 
矩阵 

u = U l v , v 3 - v ^ 

是两矩阵，而 LT AL ； 给出了所要求的形式. 

如果 A € M ,,( R ) 的所有特征值恰好是实数 • 那么 • 相应的特征向癀可以选实向攒，且上述 
所有步骤可以用实的算术运算来完成，这就是证明了后一个论断. □ 

附注 仿照 （2.3. 1>的证明便可看出，在定理的叙述中， 可用“ 下三角”代替“上三角”， 

当然它对应于一个不同的酉等价 L 7. 

[80] 2.3.2 例不论是两矩阵还是定理 （2.3. 1>中的三角矩阵： T ， 都不是唯一的.不仅 7' 的对 

角元 ( A 的特 征值〉 可以依任何顺序出现， 而11 两等价的上三角矩阵在其对角线上方可以呈现完 
全不同的形式.例如， 


是经 


的两等价. 
附注 
技巧. 



1 0 
一 1 0 
0 J 2 

一般说 来. 许多不同的上三角矩阵可以在同一个两等价类之中. 

应指出的是，证明 （2. 3. 1) 的技巧不过是如 1. 4 节中习題 8 所概述的顺序压缩 



练习 如果八=[〜]印/3 = 0"]€ 从 ： 相似，且 2], 丨〜 |2=2 | \ |2, 证明4和衫 

两等价. ） H 例 f 说明这在 尚维情 形不成 &• 提示： 汴意到 • 如果/\和/3两等价， 邶么 A + A ■和 
B + / J •也两 等价. 考虑 

1 3 01 10 0_ ' 

八=024和朽=025. 

.0 0 3 」 ‘0 0 3_ 

(2.3. 1) 的有用推论是，矩阵交换族可以同时上二.角化. 



2.3.3 定理设是交换族.那么存在一个 酉矩阵 UeAi, 使得对每个々€■>•， ITAL/ 是 
上三角的. 

证明： 回到 （2. 3. 1) 的 证明. 在原证明的每一步运用 （1. 3. 17), 在每一步都可选定一个特 
征向 W (和两矩 阵〉， 且对每个 Ae 令都可以选定这同一个特征向摄（和两矩阵〉.又酉等价保持 
交换性，且分块矩阵乘法计算表明，如果形如 





0 
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两个矩阵可交换，那么 A 22 和 B 22 也可交换.因此，在证明 （2.3.1) 的化简过程中的每一步，每 
个 A , 都继承了交换族性质.我们得出，对交换族的所有成员，可用相同的方式选择 （2.3. 的 
1/中的所有组成部分，这就证明了 （2.3.3). 值得指出的是，这里并没有断言，对各个族的成 
员的特征值，可以选取任一特定的次序.它取定的只是应用 （1.3. 17) 时所得到的那个次序 .口 
下面的定理包括了 （2. 3. 1) 的严格的实形式. 

2.3.4 定理 如果 A6MJR), 那么有实正交矩阵 Q6M,(R), 使得 

e 

e M.(R), 1 < ife < w, (2.3.5) 

A * . 

其中每个人或是 1 X 1 实矩阵或是具冇一对非实的 « 共轭特征值的 2 X 2 实矩阵. 对角 子块八 
可以按任意的次序排列. 

一般说来，不能指砑通过一个$ 相们 （窆不用说实正交相 似了） 把一个实矩阵化成上三角形 
式，因为可能的话，对角元将焙特 Kfi ， M 特征值可以不是实数.形式 （2. 3. 5) 是通过实正交 
相似所能得到的与三角形式 M 淒 if . 的形 .1；. 如果 A 有任何非实特征值，形式 （2. 3. 5) 就不会是 
上三角矩阵, 但它总是呈上 rtesRdbe 邙形状 • 

练习试修改 （2.3.1 的论证以证明 （2 •丄4>, 提示： 如果 A 是实矩阵 A 的实特征值，耶么 
介一个相应的实特征向 M , 可以用匕来压缩 A , 使呈 （2.3. 1>中的形状.如果的 
" II :-实特征值， fl . * s = u f iv^O , u . R '« id : 明 = 一 / h ，， Av = wf 和 Aj ，= 

A * r ， 冉 W : 明 U ，3 是无关组.证明 U , W 是无关组，然后对它应用 Gram - Schmidt 过程得到实 
的标准 正交组 （its 设“是前两列为 u ， 和 z 的实正交矩阵，证明 82 


QMQ, = * ......*...... ： . ， 

0 i A 

_ • • 

这时，一次可使 Am 缩 两列. 应该指出， ft (2.3.5> 中，相应于每个实特征值和每对复共轭特 
征值的子块 A , 可以按任意规定的顺序排列. 

(2. 3. 3>也有一个在实的情形下的变形. 

2.3.6 定理 设■歹交换族.则存在实正交矩阵 QeMJR ), 使得对每个 AH 
Q'AQ 为 （2. 3. 5) 的形式. 

练习 试修改 （2.3. 3> 的论证以证明 （2.3. 6). 提示： 首先， 用 所有实的公共特征向 M 压缩 
/的所有 成员. 然后考察非实公共持征向 M , fl 如 <2.3.4> 的证明所做的那样一次压缩两列. 
要注意的是，经一个公共的实正交相似之后，歹的不同成员可以有 不同的 2?<2对角子块，但 
是，如果一个成员在某个位 S 有一个 2 X 2 子块， 而另一个成员却没有，那么后者必须在相砬 
位置有一对相同的 1 X 1 子块. 

习题 

1. 设 • rec " 是给定的申位向量（1>=1>，&记0*=[4, y ] r , 其中 々 ec ， 而 yee •. 


[A 


Q'AQ 


a 2 




选取呢只使々）0,然后定义 Z = e 、= [ Zl ， f T ]， 其中是非负实数，而？ ec ” 1 •证 
明矩阵 



是酉 矩阵.提示： 计算得出矩阵 C /= 疒是其第一列为已知向 量工的 
酉矩阵.这为 Schui ■定理 （2.3.1) 的证明中的逐个压缩步骤，提供了一个求所需酉矩阵的构造 
~ 83 ] 性 方法. 

2. 如果是给定的单位向量，说明如何改进习题1中所描述的构造法，以便得到第 
一列是 i 的实正交矩阵 Q 6 MJR ). 证明你的构造方法是可行的. 

3. 设解释 A 的非实特征值（如果有的话）必须成共轭对出现. 

4. 考虑产 

m 

试说明定理 （2. 3. 3) 中的交换性假设虽然是多可同时酉上三角化的充分条件，但它不是必要 
条件. 

5. 设 hMi ， …，是给定的族，且设 

劣= = 1，2,…，走 } 

是穸中矩阵的所有两两乘积组成 的族. 亊实上，如果货是交换族，那么，箩可以同时两上三角 
化的充分必要条件是每个换位子 A , A ,- A y A . 的每个特征值都 是零. 证明关于劣的交换性假设 
是比茨的交换性假设要弱的 假设. 同时证明，习题4中的族多有一个相应的交换族 I 它还满 
足零特征值条件. 

6•设 A , 已知，且假设 A 和 B 同时相似于上三角矩阵；即对某个非奇异矩阵 

M ., 和都是上三角 矩阵. 证明 AS — BA 的每个特征值必定是零. 提示： 如果 

△,，仏云^都是上三角矩阵^“一^仏的主对角线是什么？ 

7•虽然每个方阵可经酉相似化成上三角形式，但这对复正交相似不 成立. 如果某个 
可以写成 A = QAQ T , 其中， QeAf •是复正交矩阵，而是上三角矩阵，证明 A 至少 

有一个特征向 Mj ：6 C •使: r T : r ^ O . 考察 A=D jJ , 试说明不是每个可以经一个复 

正交相似上三角化. 

8. 设是给定的复正交矩阵，且假定: r 6 CT 是 Q 的相应于特征值 A 关士 1的特征向 
M . 证明 xksO . 提示： 在恒等式 Qx = Ai 的两边各乘以自己的转 a . 关于两个特征值都不 
tS ] 同于±1的 2 X 2^ 正交矩阵族的例子，可参看 （2.1) 节的习题 8( a ). 证明，这些矩阵中没有任 
何矩阵可经正交相似化为上三角矩阵. 

进一步阅读关于习题5所确立的定理 （2. 3. 3) 的较强形式，其证明可参看 Y . P . Hong and 
R * A . Hofn * “On Simultaneous Reduction of Families of Matrices to Triangular or Diagonal Form 
by Unitary Congruences 9 f 9 I.inear and Multilinear Algebra 17(1985), 271-288. 




哲等价和正规矩阵 


61 


2.4 Schur 定理的若干推论 

Schur 两三角化的几个基本推论说明了它的效用. 

练习 利用 （2.3. 1>证明，如果 A 6 A 1 有特征值 A ,， …， A -, (包 括重特征值 h 那么 
det A = (\ X , 和 tr A = 在第 1 章中，这是用另外的方法证明的 .提 示： 关于迹，应想到由 

1 = 1 …I 

直接计算可推出 tr AH = tr BA , 因曲迹是相似不 变贵. 关于特征值的其他初等对称函数，你 
认为如何？ 

每个矩阵都满足它自己的特征方程 （2. 4.2)，这个结论可由 Schur 定理和关于三角矩阵乘 
法的一个简单结果推出. 

2.4.1 引理 假定 K = [〜]和 T =[/ J 6 M , 是 上三角 矩阵，且〜=0， j ^ k < n , 
tk - n.kn =0. 设 T ' = 「，〜 ] = KT ， 那么 〆 •>=()， j^k \ 1. 

证明： W 为尺 （1, 2, …， 々）= 0 和所以尺和丁有形状 



其中，分块后的心上子块都是 的. 根据分块矩阵的乘法[见（0.7> 的有关记号和基本结 [85 J 
果 T # 的々 X 々左上子块显然是 0. 通过观察发现，/《的前 A + 丨行有0的位 W 对着7’的第々+ 

1 列 的所有非零位酋，而7’的前 A + 1 列有0 的位置对卷尺的第 A + 1 行的所有非零位 ffi . 于是 
矩阵乘法表明， T ' (按同样的分块）冇形状 



因而丁^丨1，…，々十1>)=0,这正是我们要证明的. 口 

练习证明两个上三角矩阵的乘积是1 ：〔角矩阵，并证明两个有相同划分的分块上三角矩 
阵的乘枳是分块上三角矩阵. 




练习推广 （2. 4.1), 证明，如果 R 和丁是 h 三角矩阵 ， H r = RT , 那么， 
了’ （ < / ， / + 1 ，… j = R ( < i , / { 1 ，…， !• + )}) T“ ，• ， / + 1 ，…， /• + )}) . 


2. 4.2 定理 （ Cayley - Hamiltom ) 设⑴是 M B 的特征多 项式. 那么 

/>.» ( A ) =0. 

证明： W 为 />.“/)是《 次的，且首系数为丨，又 A “/> = 0 的根正是 A 的特征值 A ,， 
(计相甫特征值），可以把 / m (/> 分解成 


，义 《 


利用 （2.3. 1>，把/\表成 


pA ^ t ) — (r — Ai )( / — A ； )•••( / — A w ). 


UTU . 


其中： T 是上三角矩阵， 且在 它的第/个对角元位 i = l , …，现在算出 
Pa(A)^ p A (UTU 9 ) = (UTV -X t l)(UTV -X 2 I)-(UTV -Xj) 

圆 =[ L /( T - A ,/) L /* ][ L /( T - A ：/) L /* ]...[ L /( T ~ AJ ) L /-] 

= U[(T - X, l)(T - X 2 1)-(T - X n I )~\W 
= Up 、 (T)lT ， 

并注意到， />^( A ) = 0. 当且仅当 / u ( r >=0. 此外. 由引理 （2.4. 1> 得出 ^(7)=0. T - A ,/ 
的左上 1 X 1 子块是0,而7—々/的2, 2元是0:凶为它们都是上 H 角矩阵，所以（了 一 AJ ) 
(r 一 A :，/> 的左上 2 X 2 子块是0，根据 n 纳推理，因为 （ T 一 Ai /> … （7 •— AJ ) 的左上 AX 々子块和 
的々+1，々+ 1元各为0，社都是上二•角矩阵，所以（丁一幻 />... rr 一夂 +•/) 的左上 
(々+ l)xa + l ) 子块是 0 . —直连续计 算到… 便得到乘积 A .、 （ 7*) = ( T — A I />...(T — u >= 0 , 
证來 □ 

练习 " F 述关于命题 Aa ( A )=0 的论证冇什么错误？ “ W 为对于 . A 6 M fl 的每个特征值 A 冇 
/ mU ) = 0, 乂 W 为 (/(/ U 的特征值是 g ( A >, 其中*/是一个多项式，由此推出 / m ( A ) 的所有特征 
值是 0. W 此， Aa ( A ) 是0•”这是关于 Cayley - Hamilton 定理的一个常见的错误证明.给出广一 
个明显的例子来说明它错在哪里. 

练习下述沦证的错误是什么？ “W 为 A ), AA ( A ) = det ( A /~ A ) = det ( A - A ) = 

det 0 = 0,所以 a .( A )=0 m . 

如果 AW > = ck . t (//- A ) 表示 A 6 M ” 的特征多项式， AP 么特征方程是 p 4 (/>= o . 特征方 
程的根是 A 的特 征值. Cayley-Hamilton 定理常常解释为“每个方阵都满足自己的特征方 程，” 
但这必 须认*弄懂： 纯 M 多项式首先是作为 / M (/) = det (// — A ) 汁算出 来的，然后才从特征多 
项式出发作出矩阵 Aa ( A ). 

我 tf I 已经对貝•钉复分鲎的矩阵证明广 Cayley-Hamilton 定理 • W 而它对分旬：敢数域的 
任一子域（例如，实数域或有理 数域〉 的矩阵也必定 成立. 实际上， Cayley-Hamilton 定理纯粹 
是一个形式结果，它对分 W : 取 ft 任何域的或更一般地，取自任何交换环的矩阵也成立. 

Cayley Hamilon 定理的一个車:要应用是，可以把 A 6 R 的幕 .V U > « ) 写成/， A ， 

A 2 , …， A ” 1 的线性组合.根据线性相关的理论，容易证明，幂和 A 的更高次¥可以表成 
较低次幂的线性组合 （ 闪为若把 ft 作复数域 1. 的向 fct 空间，的维数是 w 2 >, 仴是 Cayley - 
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Hamilton 定理是上述结果的显著改进. 


87 


2.4.3 例设 



则 Aa </>=/ 2 — 3/ + 2,并且 A 2 — 3 A + 2/ = 0. 因此， A 2 = 3 A 21； A 3 = A ( A 2 ) = 3 A 2 -2 A = 
3(3 A -2/)-2 A = 7 A ~6/； A '=7 A *-6 A = 15 A 14/, 等等.另外，因为 /> A (/> 中的常数项, 

即 A 的行列式非零，所以 A 非奇异， R 可以把 A 1 写成 A 的一个多项式.再由 Aa ( A > 二 A 2 — 
3 A + 2 f = 0, 得到 2/=_ A :+3 /V = A ( —A + 3/>, 或 


这表明 A 



/ = /\[ y(-.A + 3/) 

- 1/21 
3/2」• 


练习已知 AeM , 有特征多项式 

十 “ w |,” 1 + a m -2t n ? … 

试把 K 成关于 A 的次数至多是 ，I 一丨的多项式.试对 A 的次数大于 《 — 1 的几个相邻次数的 
¥. 把它们也写成 A 的次数至多是 《 — 1 的多 项式. 另外 • 假定非奇# ( A 关⑴，把 / r 1 也 
1成 A 的次数至多1的多项 式. 这后一结论可作为 （2. 4.2) 的一个推论. 


2.4.4 推论如采/焙非命奸•矩阵 • 那么存 在次数 至多是 W —1 的多项式 (/(/ M 它的系数、 
取决于使得 A ] = q ( A ). 

练习如果两 t 矩阵/\， /3 eM _ 相似. iff 明其中一个矩阵的任一多项式相似于另一矩阵 
的 M —多项式，特別坫 • 一 个矩阵所满足的任一多项式方程，另一个矩阵也 满足. 试名虑逆命 
题：满足同一*组多项式的两 t 同阶矩阵是相 似的. 它成立还是不成 u ? 


2.4.5 W 已经证明，每个矩阵/满足某个《次多项式 方程. 例如，特征方程就是一个 
例子.伯码， AEiVt 满足一个次数小于”的多项式方程也是可能的•设 

1 0 0 - 

a = 0 1 1 e m 3 , 

.0 0 1 _ 

则 A 满足 y , A )= 0 ， 其中 </(/>=r 〜 2 /+ l 是 2 次的. [~ gg ~| 

练习证明-个可对角化矩阵满足一个次数等 F 其不同特征值的个数的多项式方程，并 M 
它不满足 &低 次的多项式方 R . —个矩阵所满足的（萏项系数为1的）极小次数的多项式（它的 
极小多项式）是下一章要进一步研究的对象，它与 Jordan 标准形有密切的关 系. 提示 ：考虑 
q ( t )^=( f - X l ) —(/- A ,), 其中 IfA " 

Schur 定理的另一个用途是，它们能用两种说法来解释每个矩阵“几乎”是可对角化的•第 
一种说法是，存在一个可对角化轵阵，它可以任意接近于一个已知 矩阵； 第二种说法是，任一 
Ll 知矩阵相似于这样一个上-角矩阵 • 它的非对角元可以仟意地小. 



2.4.6 定理设对任意 e >0 •存仵一个矩阵 AU ) = [心 （ e )] eM „ ，它 有”个 
不同的特征值（因而它是可对角化 的）， 且使得 

2 I — a , jie ) T < €• 

»•>=* 

证明： 设是酉矩阵，使得 AL /二了 是上三角矩阵. SE = di ag ( q , e 2 ，…， e „), 
其中^，…，〜选杼这样一些数，使得 

u l<c (含) ' 

n 数心十/ 22 +~，…，匕十4是包不相同的 • （稍加思考便会发现，这是可以做到的 .） 于 
是丁+£有”个不同的特 征值： /"+**,，…， f „+ G , 且 A + L / EL ； •也如此，这 是因为 它相似 
T T \ E . 设 /\( e > = A + L /£ y ，从而 A — A ( e > = —(7£：1/ •，& 

石 I 〜一 A ( e > I 2 = 士 U . | 2 < w (含) = ^ 

我们已经用到了（2.2.2).因此，适合定理的要求. □ 

缠习证明 （2. 4. 6> 中条件 V ( ^ | a, t — a „ ( c ) | ? < e 可以用 max ,., | 〜一〜 （ e ) | <€ 代替. 

提示: 运用上述定理时，用，代衿 e , 并意识到，如果平方和小于那么其中每一项的绝对 
值必小干 e . 

[MJ 2. 4.7 定理设 AeMy 对任意 e >0, 存在一个非奇异矩阵 S , 6 使得 

'AS, = T, = [/„(€)] 

是上二角矩阵 ， M | t ti U ) I < c , 

证明： 苜先应用 Schui •定理得到两矩阵•和上三角矩阵丁使得 

V AU = 7 

对一个非芩纯 Wa ， 定义 D a = dia g ( l ， a ，'• …， fl " | >旦令/ = 0 ^^, | 〜 I . 假定 e < l , 因 
为在这种情形下证明本定理就 SJ 以了. 如果/<1,设 S ,= l ； D ,; 如果设 
不论在哪种情形，相应的 S , 都钉证明定理的 论断. 例如，如果/<1，通过简单的计箅可知， 
/,,( e)=/ v e V=/,,f S 它的绝对值不大于 f 、又如果/<_/,这个值就不大于另一方而， 
如果/>1，仅仅用一个经 D ," 的相似作用于矩阵了，便得到其所有非零元的绝对值不超过1,的 
矩阵. Q 

练习证明 （2.4. 7>的下述 变形： 若 . V 6 M N 且 e >0, 则存在一个非奇异的 S , e M , 使得 
S ， 4 S ‘ = 7； = [/ y U )] 是上三角矩阵，且 E | / y ( e ) |< e . 提示 :应用 (2.4.7>，其中用 [2/ w( w — l)] e 

i>i 

代替 e • 

从 Schin ■定理出发不难证明它的一个推广，这个推广向卜*一夺中要出现的 J or dan 标准形 
迈出了:®要的一步. 

2.4.8 定理假定有 n , 重特征值 A,，A = l , — , k , 旦 A , ，…， A * 是互不相同的•那 
么 A 相似于形如 
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T ? 0 
• 

0 T k 

的矩阵，其中: T ,€ M „ 是所有对角元为的上三角矩阵， i = l . k . 如果 A 6 At ( R >, 且/\ 
的所有特征值都是实数，那么也有同样的结果， &相似 矩阵可以取实矩阵. 

证明： 首先应用 Schur 定理 （2.3. 1) 使 A (两）相似于一个上三角矩阵丁=[~]，并且假定 
在 T 的对角线上作了编排，使所有的项 A , 都出现在前面，其次是项 A 2 , 如此等等.下面，要 
对丁作一系列简单的（非两）相似变换，以期得到对角线上方的各个0元，且不改变了的对角 
或者上三角结构.设氏 fiM , 中的在「，>•位 置是 1，而其他位 S 都为0的 矩阵. 注意， 对… 
和任一纯 ft a , / + a £： n 是非奇异矩阵 • 且 （/ + 0 E n ) l = I - aE n . 此外，由直接计 苒可知 ，对 
r <>， 经/十 a £, 的相似 

(l^aE n r l T(I-haE n ) = (I- a E n ) T( / + aE 0 ) 

只改变了的第/ •行中 位于第列右边的元素和了的第 A 列中位于第 r 行上方的元索， 

[ W ]， 

并且用 


tn +a(/ rr — /«•) 

代替闪此，如果选取 


a=r (/:-〜■) 

便可使 r ， .、•元为0， IW 对有关结构未作其他的 变更. 现在考虑丁中一系列 位罟： （《_1， w ); 
("一2，1 ), ( w ~ 2, n )； (”一 3 ， w — 2)，（”一3， w — 1), ( w — 3， 《>; (w —4, ，，一 3>, •••• 
如果可以依次指定一种相似使这些位 W 的每个元索变为0，我们注意到，这样做不会 
影响已经变成0 的元. 所得到的矩阵将相似于这正是所要求的 形式. □ 

练习证明，如果 A 6 M ，（ R >， M 它的所有特征值都是实数，那么，在 （2. 4.8) 的证明中 
所必需的运算都珂以在实数范围内完成，于是，在这种情形，定理保证能得到分块对角矩阵， 
而所必需的相似矩阵可以取实矩阵. 

附注假定一个已知矩阵是上三角矩阵.且可以假定它已化简成如下形式（如 
粟有必要，可对它作置换 相似〉 



其中， 每个对角子块 .4" 是上三角矩阵，且在其对角线上只有 A ,， 还假定/关_/时有 
关 A,， 证明定理 （2.4. 8> 时所使用的算法说明 • A 相似于 




0 


LO a u j 

即： 在这种情形下，所有非对角子块可以用零子块来代替，且保持相似性.因为酉相 
似保持各元素绝对值的平方和，所以应当注意，如果有任一非对角子块是非零的， 

就不可能用一个酉相似得到这一结果. 

现在利用 Schur 定理的交换族形式 （2.3.3) 证明 • 对珂交换的矩阵，特征值可（按某个顺 
序） “相加”. 

2.4.9 定理设 A ， ■分别 有特征值〜，…，〜和…，式.如果 A 和 B 可交换，那 
么存在指标1，…，”的一个排列，••，…，/«•，使得 A + Z 3 的特征值是 cn +义 ， fl2 +/?,， …， 
… + P 、. 特 別是， 加果 A 与月可 交换. 那么 rr (.4 + /0&7(/ U + rT ( m . 

证明： 如果/\与《可交换，根据（2.3.3>,它们可以同时上 二 :角化，即存在两矩阵 L 76 
使得 

U-AU = 了 和 （7 •汉/= /? 

都是上三角矩阵，且分别 rt 杯对角元… •…， 〜 及乂… •足. 

LT(A + / i > a = T^r R 

冇对角元 

“I + A, ， a? + A ， ， … • t + /?、 • 

W 而也以它们 为特征 fR . 闵为 \ + B 相似于 T + K , 所以它们必定也 A + B 的特 征值. □ 

2.4.10 例应汴意的; ft , 即使 々•与 B 可々•换，也未必所釭形如《,+汉的成员都诘 A + / i 的特 
征值. 考察对角矩阵 

「1 01 「3 01 

roon A =… 和 B = 

L 21 Lo 2J Lo 4」 

便会 发现.1+4 = 5 戸 {4, 6>= a ( A - fB ). w 此，当/\与/3可交换时 ， WA + B ) 包含仵 W A ) + 
( T ⑻中，但一般不相等. 

2.4. 11例如果 A 与 B 不交换，那么要用 ( T ( A >+( j (⑴来说明 WA + B ) 是很闲难的，特別是， 
WA + B ) 不一定包含在此4>+(7<扪中.设 

A ro n r ^ ro oi 

A = 和 £}= , 

L、oJ Li 0」 

则 a(A 1 /3> = { — 1， 1}， ifij ' a ( A )= a (. B ) = { 0 ). 

2.4.12 例 （2.4.9> 的逆命题成立吗？如果 A 和 B 的特征值可按某个顺序相加，与 B —定 
可交换吗？回答是否 定的， 即便是对于所有纯 M a 和心 aA 和辦3的特征值可按某个顺序相加， 
与片也未必可 交换. 这是一种有趣的现象，而刻划这样一对矩阵的特征还是一个尚未解决 
的问题！设 
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1 4 

5- 


~2 1 2 

A = 

0 2 

6 

和 B = 

0 3 3 


-0 0 

3」 


0 0 4. 


它们的特征值可相加，与 Zi 不交换.显然，可同时上三角化是特征值具有可加性的充分 
条件，但它乂不是必要的. 然， 上三角矩阵不一定可交换. 

2.4. 13推论假定 A . 是分別具有特征值〜，•••，〜和…，/?,,的可交换矩阵.如 

果 a , 关 一 /?,, /, )=1，那么 A + B 是非奇异矩阵. 

练习用 （2.4. 9>证明 （2. 4. 13). 

练习证明，对仟窓一对 A , B 6 M „( 可交换或不可交 换 ）， A + B 的各特征值的和是 A 的 
各特征值的和加上 B 的各特征值的和. 提示： u(A + B > 是什么？ 

我们已考察过可对 角化矩 阵的同时对角化问题 • 对此，交换性&一个容易验证的必要充分 
条件，也考察过同时 .= 角化问赖，对 了它， 交换性是一个充分条件，但不是必要条件. 鉴尸能 
够证明两个已知矩阵不 nf 同时二•角化往汴是很冇用的，所以，疳钥能够找到一个比特征值具有 
可加件这一条件®强的必要 条件. 下面的例了•指出了实现这一条件的途杼. 

2. 4. 14例设 



「0 1 O') 

'0 0 0_ 

A = 

0 0 - 1 j 和 B = 

1 0 0 


一 0 0 0j 

0 1 0 . 


A 和 B 都有三 承特征值0,它们的任意线性组组合 + 也是如此，于是，它们的特征值可 
相加，由于这些原因，似乎冇理由相信/\和/彡是同时三角 化的. 但是，假如冇某个作奇好 
郎•阵 使 m . SA.S ' fll SBS 1 都是上二•角矩阵， m^iSAS l )(SBS 1 ) = S / W 3 S 1 的特征 

偯一定是 A 和 B 的特征值按某个顺 序的 乘枳. Sift , 的特征值的集合是彳一 1, 0,丨>,它 
汴不包渰在集彳0丨和集彳0> 的集乘枳 之中. 由此，我们得出结论， .4 和 S 是不可同时上三角 
化的. 

练习证明上例中的一个 论断： 如果 C ， 都是1：三角矩阵， fl |5 么 CD 的特征值是 C ， 
和 /) 的特征值按某个顺序的乘积：即 cj ( CD ) CZa ( C ) cjUJ ). 

经一个不一定是两相似的同时上三角化问题[不过要参 ft (2. 6>节1可以用下面的 McCoy 定 
理来完幣地描述，我们略去了它的证明.消回忆一下曾述及任意多个变元的多 项式： 它只不过 
是各变元的 W 的乘积的一个线性 组合. 如果诸变元是非交换的，那么相同变元的 不问幕 可以与 
其他变元的幂的积相间地出现在某个乘积之中. 

2.4.15 定理 设 A ， 分别有 a ( A > = { a , ，❼，… • a J 和一⑴二彳坏，决，…，氏>( 汁算 
电特征值）.那么，存在非奇异矩阵 SerM „， 使得 S 和 S 都是上三角矩阵，当旦仅 

当存仵指标 1，2，…，《 的一个排列 I ,， i z ， …，£•„，使得 W / KA ， B )) = { p ( a it p t) )： > = 
1，…， W 对两个（非交换〉变元的所有复系数多项式 〆 .、•>成立. ’ 

练习验证 • 如果 .4 和 B 可同时三角化， （2.4. 15) 中的多项式条件是必 要的. 证明，如 



果為， iieM ,, 可交换，那么 cr (/>( A ， B ) ) = {/>(«,, p , )： > = 1, —. n } 9 对两个变元的所有多 
项式/> 成立. 定理 （2. 4. 15>是如何适用7例 （2. 4. 14) 的？ 

附注定理 （2.4. 15>的结论对任意域上的矩阵和多項式都能成立，只要这个域包含这 
两个矩阵的各特 征值； 对于々 = 3，4,…个矩阵的同时三角化，定理也成立（这 时. 
定理的条件要涉及々个变化的多項 式）； 并且，就是对于特征值的限定子集，定理也 
成立，即 pi ai , # >6 Wp ( A , B )), )=1，…， r ■对所有多项式 />( s , /) 成立，当且 
仅当 A 和 B 同时各自相似于这样一个分块三角矩阵，在这两个分块三角矩阵的对角 
线上的某些相应位置分别有由 〜，•••，〜 和斤•…，汉,组成的 1 X 1 子块. 

习题 

1. 假定 A , 可交换，且分別有特征值 〜，•••， 〜和 … ，尽. （ a ) 证明， AI 3 的 

特征值是， 吨，…，4,， 其中 “••••， I - 是指标1,…，”的某个 排列. （ b ) 如果/>(.、•, 
/>是两个变元的多项式 • 证明 /»( A , B ) 有特征值 />( a , , A ,), …， />(•〜， 足〉. （ c ) 最后证明， 
可同时上三角化这个较弱的假设足以得出上述结论：交换性不是必要的. " 

2. 如果证明 A 的秩不小于 .4 的非零特征值的个数. 提示： 试证一个上=角矩阵 
的秩至少等于非零主对角元的个数，然后利用 Schur 定理（2.3.】>.用例子 

A = 

说明/\的秩为什么可能大于非零特征值的个数. 

3. 本题的 B 的是要证明， Cayley - Hamilton 定理对其元家取白 交換环 而不一 定取自 笈数域 
的矩阵成立.交换环是这样一个代数结构，除了乘法逆元的存在性以外，它满足域的所有公 
if . W 此其“加法”与“乘法”运算是交换的， M 满足通常的结合律和分 配律. 我们也明确假定在 
该环中存在乘法单位元；即存在元素“1”使得对该环中的所有“都有娃一个环而不一 
定足域的例+珐厶=所冇幣数对々的模.在 Z * 中，•‘加法”与“乘法”不是通常的运算，但其运 
算结果 是对々 取模： 4是一个域当 &仅当々是素 数.另一个例子是具有复系数的 A 个形式未定 
元的多项式集合. 

( a ) 我们知道，若则 adjAGAl 是其/，_/•元为.4的_/，/代数余子式的唯一矩阵 
(见 0.8.2). 证明 • 基本公式 

A(adj A ) = (adj A ) A = (det A ) l 

正 好是用 代数余式表示的 A 的行列式的 Laplace 展开式的一个表达式，并且证明，若 A 的任 
意两行或两列 相等， 则 det /\ = 0. 注意到这个公式只涉及乘法和加法而不涉及除法.证明该公 
式对其元家取自任一交换环的矩阵是成立的. 

( b ) 利用 （ a > 证明 

("— A )[ adj (// — A )] = [ adj (// — A >](" — A ) = det (" — A ) I — p A (. t)I 
对仟意 AeM ”， 甚至对其元索取自一个交换环 nX 〃矩阵都 成立. 证明，矩阵 ad〆 // 一 A ) 是这 
样〜个矩阵，其元素是次数不超过 《—1 的/的多项式，因而它可以写成 

adj (" 一 h 、 = A m .,r 1 +汽「 ? 广 2 + … + .4,/ 十 A 0 ， 
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其中系数 A* 是矩阵，其元素是 .4 的诸元紊的多项式函数 . 多项式 ( 。是 A 的特征多项 
式 . 

(c) 证明，若 A 是一个其元索取自一个交换环的 W X” 矩阵，则 

t k I -A k = UI -A)Ut k l + A/* 2 + …十 A *_ 2 / 十 A* *) 

=(// — A)G t (A,t) 

对先 = 0 ， 1, 2 ， … 都 成立. 由此得出 

t k I = It k = .A* + (//-A)G,(y\,/>, k = 0 ， 1 ， 2, …. 

(d) 设 p A (t)=a t ,r-\-a n ， /" ' 十 … 十 “, / 十 ao = (let(/J — A ) 是 A 的特征多项式（其中 a H = l), 
并且注意到它对其元素取 fl — 个交换环的矩阵也是有定义的 . 利用 （ c > 证明 

餺 m 

*•0 *-0 

= - A)GiA,t), 

其中 

m 

G(A , t ) = ^a k G k (A^t) 

* 胃 0 

il • 一个次数不超过 ” 一 i 的 / N 多 4 式，以矩阵为系数 • 其元索是 a 的诸元索的多项式函数 . 
现在用来证明 

p A 、/\'、= p A UU — （ t! A)G(A,t) 

= A)adj(// — A) — (// — A)G(A,r) 

=ill — A)H(A 9 t) = Q a (/), 

其中 //(A， t ) = B n ,r '-f-H,, 2 /" '4 … +认/+ 氏 • 而每个队是一个 / jX ” 矩阵，其元索是与 
/无关的 A 的诸元家的多项式闲数. W 此 Q ,、（ M 是一个 H 有矩阵系数的次数不超 过”的 /的多 
项式. 

(e> \y% Qa(.A), 由此得出 /M(A> = 0. 

4 - 设是非奇异 方阵 . 证明任何与 A 可交换的矩阵也与 A 1 可交换 . 提示： 利用 
<2.4.4). 然后直接验证 . 

5. 用 （ 2. 3.1) 证明，如果有特征值义， • 心，…，那么 

_ 

V^Af — \r A k 9 k = 1,2,— 

6. 证明，对 


A = 

「1 0 0- 

0 2 0 

和 B = 

-2 

1 

1 2* 

-2 - 1 


0 0 3. 


1 

1 1. 


以及对所有纯 Mc /，66 C ， 有 = U — 2心 2a - 2b , 3“ + M ， 但是 A 和 B 不能同时相 
似于上三角矩阵. 

7. 利用 （2. 3) 节习题6中的论据证明例 （2.4. 14>中的两个矩阵不可能同时上三角化.试对 
习题6中两个矩阵作同样的证明. 
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8. 在证明两个矩阵不西等价时， McCoy 定理 （2.4. 15>的指导思想可能有用的.设 〆/，.、•） 
是两个非交换变元的复杂数多项式，又设 A ， 两等价，即对某个丙矩阵卩 

有4 = 17衫1/'证明/ *( A , A * ) = UP ( B , B 9 ) U \ 因此，如果 A 和《酉等价，则对每个具有 
两个非交换变元的复多项式/>(/， s ), tr p ( A , .4* ) = tr p ( B , B '). 这与定理 （2. 2. 6) 有什么 
关系? 

9. 设/是给定的，且假定 .4 和没有公共特 征值； 即 cT ( A > rU ( B ) 是空 

集. 利用 Cayley-Hamihon 定理 （2.4.2)证明方程八久一；^ = 0, 只有解X = 0 . 由此 

得出结论，对每个已知方程 AM — X /3 = ( •有唯一解 提示： 如果 = 
Xii . 用归纳法证明，对所冇务=1, 2，••••， A t X = XB k , 从而对任意多项式 />(/)• 有 〆 = 
Xp ( B ). 选取 〆 />为 A 的特征多项式便得到 Aa (A)X-0- XAa («). 闪为 p A ( B > = U3 — 入山… 
(/ i ~ A ./)-( B - Aj ). 其中 A , … ，夂 是/\的特征多项式，所以矩阵/ » A ( Zi > 是非奇的，因而 

川=0 K 有零解 X = 0. 由齐次方稈解的唯一性，并 ft 将 （0.5 々和/>应用于上的线件 
变换 X — T ( X > = AX — 便可推出，对方稈冇边任一已知矩阵 C：，/\.Y — = C 的解存 在. 

10. 利用习题9给出定埋（2.4.8> 的一个证明 • 要求递推步骤不超过6 — 1步. 提示： 把 A 

写成 

「 A " ^1? … - A ,*! 


….〜 [An 

\ ： = L 0 rJ * 


其中毎个疋足 K •主对角线上只打 A , 的上三角矩阵 ， [i R,=[A 

^• r 1 x l s . = r 7 - x i 

Li 


考虎 


[1 

.0 


一 X 


其中 X 与尺，同阶.证明 


y [ A ; 


U 需选X适合 A,,X — = —K,. 依次按行做下去便可得出4相似于 diag(Au, A „ ，…， A tt ). 

11. A 、 已知， a 考虑換位子证明 trC =0. 考察 A =「 0 (> 1和《 = 

Ll OJ 

_ 0 q ]' 说明换位+不必是幂零矩阵 》 也就是说，即使一个换位子的各特征值的和肯定为零 • 

它的某些特征值也可以是非零的. ' 

12. 设 A , C = AB - BA , 且假 定焱与 （：可交换.证明（：必定是幂零矩阵.试对 

习题11中的例子作出 说明.提示： 为什么存在非奇异矩阵使得 SCS 1 = diag ( C n , 
C 22 •…， () = C ,. 其中每个 （’ n M " 是上三角矩阵 • / I , + « 2 十…+ ”* = ”， a ({ A , K 


(/=1，2， …， ♦)，且 A •关 A,，（*»>? 设 A 丨三 SAS 丨， B,=SBS *, 且把弋 =( 和 A = 
( B „) 写成与 Q 的分块对角形式同型的分块 形式. 证明 A , C , — GA ,， 然后用习题9证明，只 
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要 々> ltu 关_/，就有 A ,，=0. 于是每个（：„=丄川一艮1有“6=0,因而 A ,=0; 而々 =] 

时； C 显然是¥零矩阵. 

13. 采用习题9的记3.利用定理 （2. 4.9) 给出如下奉实的另一个 证明： 若/ V 与 fi 没有公 

共特征值，则对于每个 CeM ，， 方程 AX—XB = (: 有唯一解. 提示： 芩 虑用丁 ,（ X >= AX , 
乃（；0 = ；^定义的线性变换丁，，了 2: 证明乃与乃可交换，由 （2. 4. 9) 推出了 

的诸特征值是 T , 和 r : 的诸特征值之差.证明， A 是 T , 的一个特征值3且仅当存在非零 xe 
M 使得 .4 X—AX = 0, 这可以成立当且仅当 A 是 A 的一个特征值[考虑 X 的非零列].因此 
T , 的特征值的集合与 A 相同，同样，7\•的特征值的集合与 B 相同.因而，若 A 与 B 没有公 
共特征值，则 7' 是非奇异的.若 ifiA 的相成 于特征倌义的一个特征向《,时 . v 是的相应 
于特征值 p 的一个特征向 M , 考虑 X = jV , 证明 T(XXA m ) X . 由此得出了的特征值的 
集合由 A 的特征值与 B 的特征值的所有可能差组成. 

14. 设？ ={ A •: /€./} 匚 iw _ 是一个交 换族. 证明， •> •在下述意义 r 可以同时 上三角化：其 
中仟意一个给定的成员化简为 （2. 4. 8) 中的特殊形式，而其他成员化简成共形分块对角上三角 
形式. 即对于每个给定的 A , 6 证明， fr 在 •个非 奇异的使得对所有的/€义 A ,- 
Sdiag ( ri ” •…， T \'' )S 1 t 其中，对所冇 ）=1 ， 2 •…，々， w ， 十卜… + n * = w ， 以及所有 

人每个是上三角矩阵 • 而每个 7 T 的所有主对角元为 A ,, z j 丟“ 还有 A , 关 A , •提 
示： 选定 . S ’ 使得 S LIS 冇 （2. 4.8> 中的特殊分块对角上三角 形式. 注意矩阵族彳 S 
A 足交 换的. 把毎个 S 分成与 S 1 丄 . S 的分块形式共形的分块矩阵，然后利用交换性以 
及习题 9 或13的结栄 （ 像习题12中那样），址明每个 .S WS 的所冇非对角子块一定化为零. 

现 / K 可以存:处于相应对角子块的々个族上应川定理（2.3.3>.除了 S 1 人 S 以外，当然不保证 
S l A , S 的一个对角+块的特征值都相等或不同的对角子块有不相交的谱. 

进一歩阅读和注释定理 <2.4. 15> 及 K 推广是由 N . H . McCoy 证明的，可参看 N . H . 
McC \) y，**()n ihc Characteristic Roots of Matrix Polynomials , m 8 m //. Amer . Math . Soc . 42 
(1936)，592-600. 也 "f 参希 T . S . Motzkin and (). 1 'aussky • ** Fairs of Matrices with |_99 
Property Trans . Amer . Math . Soc . 73(1952), 108*114, 其中讨论了特征值与线性组合 
的: Xl 系. 一对 A ， 有性质/ 一 是指对 所冇心 /， eC 冇 a(«A + AB ) = Ucr , 十峨， * > = 

1，而定埋 （2. 4. 15) 的条件称为性质 M 然性质 P 殖涵性质 L ， 反之不成立 • 较弱 
的性质厂尚未彻底#淸楚，但还是知道一些.例如 • 一对具有性质 L 的正规矩阵[见 （2. 5>节] 

一定可交换 • 因而一定可同时酉对角化. 

2.5 正规矩阵 

正规矩阵是在 i 寸论丙等价时自然产生的一类矩阵，它在整个矩阵分析中是很重要的，并且 
它还推广了西矩阵，实对称矩阵和 Hermit 矩阵. 

2.5.1 定义设矩阵 A 6 M ”， 如果 A*A = AA •，即 • 如果 A 与它的 Hermite 伴随可交换，就 
称 A 为正规矩阵. 

练习证明， A € iW ，, 是正规矩阵，当且仅当西等价于 A 的每一个矩阵都是正规矩阵•这 
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说明正规矩阵类在酉等价下是封闭的. 



2.5.2 例 

(a) 如果 I ； 是两矩阵，那么 = ，因而，所有酉矩阵是正规矩阵. 

<b) 如果显然 /VA = AA -， 因而，所有 Hermite 矩阵都是正规矩阵. 

( c > 如果 AeiVUg 合 A.=—A, 就称 A 是斜 Hermite 矩阵 . 这时， A. A= — A 2 = AA' , 
因而所有斜 Hermite 矩 阵也都是正规矩阵. 

< a > A =[| 是正规矩阵，但它不; 4 于上述任一类 矩阵. 

练习用元素间的关系给出 M :( R > 中的正规矩阵的特征.并且按 （2. 5. 2 a , b 和 c > 的分类 
作出回答. 提示： 如果是正规矩阵，证明，如果 A 至少有一个元素为零，那么或 
A = A 、或 A=—A. 如果 A 的所有元索是非零的，证明， A = A r . 或对某个 u 〉 0 ， AA r 
— al . 

练习给出一个 2 X 2 非正规实矩阵的 例子. 同时给出一个 2 X 2 实矩阵的例子，它是正规 
矩阵 • 但不是对称的，斜对称的或正交的. 

练习证明 （2.5.2 a ， b 和 c ) 的每一类各 ft 在西等价下是封闭的. 

练习证明，. Hennite 对角矩阵必定是实的，而斜 Hermite 对角矩阵必定是纯虚的. 


2. S .3 定义如果 A 6 M ” 两等价于一个对角矩阵，就称 A 是可 酉对 ft 化， 类似 地可定义可正 
交对角化 槪念 . 应注意的是，“可西（或正交>对角化”绝涵可对角化（但反之不成 立）. 

练习考察 （1.3.7) 的证明便可得出，可西对角化，当且仅当在 C ” 中有一 个由” 
个标准正交向 fit 组成的集合 • 其中每个向 《 都是 A 的特征向 Jft . 

下面，列出关十正规矩阵的最基本的 赛实. 在下述定理中， （ a ) 与 （ b ) 的等价性常常被称为 
正规矩阵的谱定理 . • 


2-5.4 定理如果 A = [化]有特征偵夂，…，那么下述命题 等价： 

( a ) A 是正规矩阵； 

< b > A 是可西对角化 矩阵； 

E i 2 = E m 

»•>"! I " I 

( d ) 存在由 A 的; 》 个特征向 M 组成的标准正交基. 

证明： 由 Schur 定理保证，在该证明中，始终假定 TtOJe A 九是西等价于 A 的上三角 
矩阵；即对某个酉矩阵 UeiVf ”， 有:因为了酉等价于 A , 所以命题 ( a ) 等价于了的 
正 规性. 我们将证明， （ a ) 与 （ b ) 等价， （ b ) 与 （ c ) 等价， （ b ) 与 （ d ) 等价，从而完成 证明. 

为了证明 （ a ) 蕴涵 （ b >， 需做一些计算.如果 A 是正规矩阵， 那么了 也是正规矩阵.但一 
个正规的三角矩阵必定是对角矩阵，这只要令 :rr 和 it •的对角元相等就可以看 出来. ： rr 
[_ 的】，1元与： rr •的1, 1元相等表明 

颺 m 

〜= tnin + !]/„/„ =i /„ I fu l ? . 

>=2 >-2 
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这就是说，0 = 丨| 2 ,若干非负项的和为零，那么它的每一项必须为 0. 由此得出 

广2 

t\i = 0, j = 2,…，《• 

了•： T 和丁 T •的2, 2元相等表明. 

m n 

= tzotn + 2=1 ^ I 2 + 2 I f 2J I 2 * 

>-3 i -3 

同理可得 

tzj =0， j = 3* ••• «/ i . 

假定采用同样的方法已经验证 

U = 0 • ) 〉，■和 / = 1，2，…，々 一 1 

由此可以得出 

t „ =0 ， j > i，i = k ， 

依次讨论厂 T 和厂 r •的每个对角元，最后得到 

/办= 0， ）〉，•， / = 1，2 

W 为7’是 上三角 矩阵，所以乂冇 

= 0 9 ) <，•， ，• = 1，2，一 •/!. 

因此 • 证明了 T 是对角矩阵 • 因而 （ b ) 成立. 由于对角矩阵显然是正规矩阵，乂西等价保持正 
规性，所以 （ b > 也殖涵 （ a ). 

要证明 （ h > 与 （ c > 等价 • 需借助于 （2. 2.2>. W 为任一与 A 西等价的对角矩阵的对角元是特 
征值 A ,, …， > U 按某个顺序排列）， （2.2.2) 使我们从 （ b > 推出 （ c ). 另一方面，因为 A ,, / = 

1，…， w , 是 T 的对角元（按某个顺序排 列〉， 所以, (2.2.2) 也表示 

E 丨〜 I 5 = 亡 U 卜 ’+2 U 

• •>”1 I i<J 

但是 ( c ): S 味耱 

S K 1 ? =0 - 

或了是利角矩由此推出 （ b ) 成立. _ 

( b ) 与 （ d > 的等价性，是本定理之前的那个练习所要证明的亊实. n ― 

练习如果 T 6 M , 是三角矩阵，且 T 与 TT * 的第》个对角元相同， i = l , …，/ I ,证 
明了是对角 矩阵. 说明为什么这个结论连同正规性在西相似下是不变的结论是正规矩阵可酉 
对角化 的蕙本 理由. 

练习 SF 明一个正规矩阵是非亏损的（每个特征值几何重数等于它的代数重 数〉. 

练习证明，如果是正规矩阵，那么 * r 6 CT 是 A 的相应于特征值 A 的右特征向骱， 

当且仅当 * r 是 A 的相应于 A 的左特征向量；即 A*r = ^ r 等价于 ，A = Aj ^. 提示： 正规化 x , 

且记 A = [/ ALT ， 使 j •为 L 7 的第1 列. 那么， A •及 A ' j •各是什么？参看本节后面的习题20中 
的另一个证明. 

练习如果是正规矩阵，且 I 和: y 是相应于不同特征值的特征向量，证明 u ■与 : y 



IF •交. 提示:如果 A « r = A * r ， Ay = fiy , 试证 / iJ ••: y = j • ( A . v > = ( A ’* r ) • . y =( 天 * r ) • ) = ^ 1 •: y •如 
果由此得出， . v =0. 参看习题 21 的另一个证明. 

如果已知一个正规矩阵的各特征值，那么它可以通过下面理论描述酉对角化.确定每个特 
征空间，然后求它的一个标准正交基（例如，用 GranvSchmidt 过程 K W 为每个特征空间的维 
数等十其相应特征值的重数，乂 A 是正规矩阵，所以这些基的并就是幣个空间的一个标准正 
交箪. 把这些向 M 排成一个两矩阵的列便得到所要求的对角化变换. 

下面说明，可交换的正规矩阵可同两对角化. 

2. 5.5 定理如果是正规矩阵的交换族，那么」可 M 时丙对 角化； 即存在一个西相似， 
它把 .1 屮每个矩阵变换成对角矩阵. 

练习利用 （2. 3.3) 以及正规的三角矩阵一定是对角矩阵的亊实证明 （2. 5. 5). 说明 
_ (2. 5. 5) 的条件和结论要比 （1. 3. 】9>的强. 

将（2.5.4>应 用于 Hermhe 矩阵的特殊情形，便得到一个基本结果，常常称之为 Hermhe 
矩阵的谱定理. 

2. 5.6 定理如果 A 6 M ” 是 Hermite 矩阵，那么 
( a ) A 的所有特征倌都是实的； 

(1>) A 珐可两对角化的. 

如果/对称矩阵，那么 A 可实正交对角化. 

证明： 一个 Hermite 对角矩阵必定 H 冇实对角元，因而 U ) 可以从 （ b > 和 Hermiie 矩阵的柒 
合4:两等价下封闭的唞实 推出. W 为 Hermhe 矩阵是正规矩阵，所以命题 （ b > 可以从 （2. 5. •!) 推 
Mi . 如果足对称矩阵，耶么它鱿是 Hermite 矩阵，不过，我们注意到，对角化 A 所 
:一切计算均可4:实数域上进行. W 为/\的特征值诘实数，所以相应的特征向可以取劣向 

□ 

在 (2. 5. 4) 和 (2. 5. 6)中，特征值相同或不同已无关紧要了.在 （2. 5. 5>中不必假定可对角 
化条件 • 将这些与第1窣中吋对角化 的讨 论作一比较是有意义的. Hermite 矩阵和正规矩阵从 
结构上就保证它们钉一个线性无关的完备的特征向 M 组（实际上足标准正交组>,这就进为什么 
它们如此茁要 R 有411此合意的性质的理由. 

作为结束，我 fH 证明与（2.5.4 ) 和（2.5.5 ) 相类似的定理，它们是关十实正规矩阵的.这些 
矩阵是正规矩阵，因此可经 •个 未必是实的西相似对 龟化. 如果只经一个 实正交 相似，那么这 
样的实正规矩阵可能变成的最好形式是怎样的呢？ W 为一个实正规矩阵可能没冇任何实的特征 
值， 所以不能保证它可经一个实相似对角化.另一方面，任一实矩阵可经一个实正交相似变成 
特殊的分块上 二 •角形式（见 2.3.4). 如果这个矩阵还是正规矩阵，就假定它已变成这种特殊的 
形式. 证明要利用 （2. 3.4)，正像在 （ 2.5.彳> 中用到了（2.3. 1> —样. 下面的引理可消除一个小 
的技术障碍，它在 （2.5.4) 的证明中不曾出现. 

2. S . 7引理如果/ \6 riU " 是 Hermite 矩阵，且对所有 J .6 C ”， 有那么 A 的所有特 
征值非负.如果还有 tr /\ = 0,那么 A = 0. 
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证明： 利用（2.5.6)可以写出.4=以4(7、其中， L / = [ M , W 2 …是西矩阵，而4 = 
diagU ， A 2 ，…，夂>.于是 A = LTAL 7, 根 据假设可知， \ k = u ； Au k ^ O , 从而所有.最_ 
后， tr A = tr UAL /* =tr Al /’ L 7 = tr A = Ai + …十厶，因此，如果 tr A = 0 和所有 A *>0， 就一 
定有所有 A *=0， 因而 且 A = L/ALT = t 7 ()LT =0. □ 


2.5.8 定理设 A 6 iVf „( R ), 则 A 是正规矩阵，当且仅当存在一个实正交矩阵 Q 6 M „( R >, 
使得 

A , 0 

A :， 


q t aq = 


e M n ( R ), 1 <走< w 


(2. 5. 9) 


0 A * 

其中毎个 A , 或者是 1 X 1 矩阵，或者是形如 

• a, P ， 
•一 A a,- 

的 2 X 2 矩阵. 




(2. 5. 10) 


证明： 由 A ； 接汁算 可知，每个形如 （2.5. 10> 的矩阵是正规矩阵 [ A , A /' = diag ( d + 汉， a；-f 
/?；) = A / M ,], Wifii 任一 个形如 （2.5.9> 的直和也一定足正规 矩阵. 由于前面的论断，如果利用 
(2. 3. 4) 来证明定理, 那只需 对形如 (2.3. 5>的实正规矩阵来证明就 够了. W 为在（2.3.5>中诸 
主对角子块可以按任意规定的顺序排列，所以可以假定 

R A 01 . A o2 ••- 
A tl A , 2 — A u 


是正规矩阵，其中 



A 22 


0 


八2* e MAR ) 


(2.5. II) 


R = •• e m p ( R ) 

參 

0 A,. 

是上三角矩阵， A ；I| , A 02 , A 0 * eM ^. 2 ( R ), 并且对/， > = 1, 2, 々以及）彡 /, 有 

m ,( R ). 下面要证明 k 是对角 矩阵. a 对所有 ）>,, /\ y - o . 

比较恒等式>\4=焱4 7 中与（2.5. 11) 中的子块汉相对应的第一个 pX /> 主对角块元，得 
到恒等式 


RTR = /^ r + A ,,% + … + K . (2. 5. 12) 匪 

我们知逍，对某个 EGMm ， 每个形如 B = / T / T •的矩阵 B 6 AMO 是 Hermite 矩阵，且对所有 
有性质 EK - ji =( E \ r )- ( E * 并且， 这样一些矩阵的和也有同样的性 
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质.因为，按一般的原则， 

tr R T R = tr RR T , 

而且，由 （2.5. 12) 有 

tr R T R = tr RR T + tr A 0 , A 0 T , + … + tr , 

由此可见 

0 = tr AoiAj , H -十 tr A 0 * AJ *. 

根据引理 （2. 5. 7)， 且把上述结论应用于实矩阵有因为它 
们的和是零，所以每一项也是零，因而> = 1, k . 因为人 的第/个主对角 
元是的第 纟行的（实〉 元索的平方和 • 因此，这些元素必须全为零，从而 A u > =0, ）= 1， 
2，…， I 且 （2. 5. 12>简化成 

R T R = RR T . 

但是，已经在 （2. 5. 4) 中证明，一个正规的 H 角矩阵必定是.对角矩阵，所以有 /? = diag ( A ,， …， 
夂），这正是我们所断言的. 

比较恒等式 A T A = AA 7 中与 （2.5. 1丨>中子块 A ,, 相对应的 2 X 2 主对角块元，利用对所有 
)=1, 2…，々有实，便得到恒等式 

^ h^ll = A ，! A : f | + A |2 + …+ (2.5.13) 

而 tr ( A /； A "), 鎵匕曲 那样运用引理 （2. 5. 7), 于是，对 ）= 2, 3…，有 

+ …+ tr ( A lk Al k ) ― 0, triA ^ Ajj ) > 0, 
xr ( A lr Al ,) 0, A Xj A T Xl = 0和 A i; = 0， 

因此 (2. 5. 13) 简化成 AhAn^AuAJn BP 2 X 2 子块 A „ 是正规矩阵. 

依次验证恒等式 A T A = . L 4’ 的与 （2. 5. 11) 中子块 A •相对应的 2 X 2 主对角块元，其中,== 
2, 3,…，々一 1，并且甲同样的论证，如我们所断言的那样，可以 得出， 所有非对角子块都 
是零， II 所有对角子块/心都屢正规矩阵. 

我们已经证明，一个实正交相似可把一个实正规矩阵化成形式 （2. 3.5). 实际上可化成分 
IPS 块对角形式 （2.5. 9>. 只要证明所有对角子块有形式 （2.5. 10>，那就完成了幣个 证明. 

如果~ = =] eM 2 ( R > 是正规矩阵，那么，使恒等式的1，1元和1，2 

元分別相等便得到恒等式 

^ = c 2 • 从而 <*=士6, 

以及 ac-\~bd = ab - tcJ 9 从而 • 如果 r =— 6,则 

2b(a — d) = 0 . 

及 A = 0 的情形可以排除在外，因为这时4〃 将是实对称矩阵，因而只有实特征值；但是 
按我们的作法，子块 A " 有一对共轭的非实特 征值. 因此，只能有 <•= -心 a = d . 且必有 

形式 （2.5. 10). 由计算可知，实矩阵= 有一对共轭的复特征值义=“ + “ +沁和=“_ 


ib . 


□ 
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作为这个关于实正规矩阵的定理的推论，容易推导出实矩阵是对称矩阵、斜对称矩阵或正 
交矩阵时的实标准形. 


5.14 推论设 AeM / R ). 于是有 

( a ) A = A T , 当且仅当存 在一个 实正交矩阵使得 

Ai . 


Q r AQ = 


0 


A - 


,其中所有 A , 


( b ) A =~ A r , 当且仅当存在一个实正交矩阵 QeMJR ), 使得 


Q t AQ = 


0 


A , 


0 


a 4 


其中每个 a ,€ M 2 ( r ) 有形式 


A . = 


• o Al 
--A OJ 


( c ) AA T = L 当 ft 仅当存在一个实正交矩阵 QeM ，（ R >, 使得 


' A , 

Q r AQ = 



A ， 


A , 


0 


其中，每个 A , = 土丨，而每个 A ,6 M 2 ( R > 有形式 


0 


A *」 




o, e r. 


证明： 在每一种情形，定理的条件都保证 A 是实正规矩阵， W 此/\可写成形式（2.5.9>和 
(2.5.10〉. 如果； 4 = 那么每个总 W 而所有/?, =0,而 QMQ 是对角矩阵•如果 

，那么每个1 = 一七 且每个—為厂因而所有<=0且所有 a =0. 如果九 4 r =/， 
那么每个 W = 1 II 每个/ \, A T = /, 因而，所有 V = J 且所有 d 十烤=】； 这时有 A , = ±】 且 


0 ->= cos 4，总= sin 込. 口 

如果有一个由可交换的实正规矩阵组成的族，它们可能不可同时实对角化，但是可以同时 
把它们都变成分块对角形式 （2. 5. 9). 
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2.5.15 定理如果、 4 GM ,,( R ) 是实正规矩阵的交换族，那么存在实正交矩阵 Q ， 使得对所冇 
A 6.4， Q T AQ 具有形式 (2. 5. 9) 和 （2. 5. 10). 

证明： 运用（2.3.6)，可经实正交相似 Q 把」的每个成员化成形式 （2.3.5). (2.3.8) 的证 
明过程说明，它们这时有形式 （2. 5.9). □ 

习题 • 

关于的与正规性等价的条件，除了 （2. 5. 4) 所列出的以外，还可以罗列出许多.在 
下面的习题中，其中就包含若干等价条件. 

1 . 证明， AeMi 是正规矩阵，当且仅当对所有 Aj •与 .V j •的 Euclid K 度相同. 
我们知道,的 Euclid 长度. 

2. W : 明，正规矩阵是西矩阵， 当&仅 当它的所有特征值冇绝对值 1. 

3. 证明，正规矩阵是 Hermhe 矩阵，当且仅当它的所冇特征值都是实数. 

4. 证明，正规矩阵是斜 HermUe 矩阵,当且仅当它的所冇特征值都是纯虚数（有等于0的 
实部）. 

5. 如果 AeK 是斜 Hermite (相应 地, Hermite ) 矩阵, 证明 M 是 Hermitc (相应地，斜 
flerinite ) 珩阵. 

6. ill : 明，正规阵，当 ft 仅当它与••个其有5：异特征值的 il ： 规 S *: 阵可 交换. 

7. 如同定理 （2. 那样，假定 .46 M , 冇形式為二衫 1 /" • 其中适非奇 异矩阵 . 
( aHlH 明， A 楚两矩阵，当 U 仅当《是正规矩阵. （ b > 如果《有形式 B = HN //， 其中，/ V 是正 
规矩阵，而//是 Hermite 矩阵（迁它们郎是非夺异矩阵 >，证明 A 相似于一个两矩阵. 

8. 定义 f/(A> = |(A + A. ，为八云….的 Hermite 部分 . iflj *S (/\ > = j ( /\_ /A • > 为 /\ 的斜 

Hermite 部分，那么 A = HM > + S ( A >. 证明 A 是正规矩阵，当且仅当 H ( A ) 与 SM ) 可交换. 

9. 如果两个正规矩阵 nf 交换， 证明它 们的乘枳坫正规矩阵，汴 用例子 说明，即使两个正 
规矩阵不可交换，它们的乘织也可以是•正规矩阵. 

10. 采用习题8的 记号， 证明，如果的每个特征向撤是 S ( A ) 的（相应地, A 的)特征 
向《,那么 .4 是正规矩阵. 

11. 对于任意复数证明存在某个沒 6 R , 使得注意 [ dGiW , 是两矩阵.想 
—想 • 两对角矩阵 L / eH , 像什么呢？ 

12. 推广习题 1 K 证明， 如采 A - diagU , ，…， A w ) eM „, 那么疗仵两对角矩阵【八使得 
A = UA=AU. 


13. 利 用习駛 12证明 • 矩阵 AeM ， 是正规矩阵当 a 仅当存在两矩阵使得 
这与习题7有什么关系？ / 

11. 如果 AeMjRi ， 且 A 的所有特征值都是实数，证明， A 是正规矩阵，当且仅当它是 
对称矩阵. 


式. 


15. 证明，两个同阶正规矩阵相似（实际上是两等 价）. 当且仅巧它们有相间的特征多项 


这对非正规矩阵也成立吗？ 提示: 


考察[::]和[: 
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16. 如果 A ， 是正规矩阵，说明 .4 B 未必是正规矩阵，并说明某个阶数的非奇异正 
规矩阵不构成一个乘法群.何是两正规矩阵确实构成一个群.非奇异 Hermhe 矩阵构成一个乘 
法群吗？ 

17. 如果是正规矩阵，且 /»(/) 是给定的多项式，用定义（2.5.1〉证明 />( A ) 是正规 
矩阵.利用 （2.5. 对这个结果给出另一个证明. 

18. 如果冇 性质： 对某个非零多项式 p ( A > 是正规矩阵.耶么 A 是正规矩阵 

吗？ 提示 ： ^^ A== [° 2 

10. 设 A 6 M „, a a ec 是给定的.证明， A 是正规矩阵，当 a 仅当 A +«/ 是 IH 规矩阵. 

20. 设正规矩阵，并 K 假定 . reC 是使•的向试利用习题1和19证 
mA ' x = Xs . 提示： 如果向童 ( A — A 〖) o •的 Fu 、 Hd 长度是零，试证 （ A - A />-* z •的 Euclid 长度也 
是零 • 

21. 利用 （2.5.4) 证明 • 如果>2：£规 矩阵. fl 九 r = > U 和其中 A 尹…那 
么 J •与 . VIE 交.提示： 设八=^1；-, H 中钴两矩阵，而 A = diaga , …， A „>. 令 

v = /[ y ,]. uHB 弓九/ H . rf ! 此推出对每个使 A , 关 A 的指标 I •，有 
Z =0, 同理 • / 也有类似件既. f ? 还明/与 ，出 i , 认而得出 * r 与: y 正交. 

22. 利用（2.5.6>证明， 即使 ？ Prmiie V . 啷 .4 的所有元家不都 M 实数，它的特征多项式必 
定行实系数. 

*1 | ^ 「y y ■ 

23•证明， . | 和\ 1都足 S 对称圯阵 （A = AM ， 但一个是正规矩阵，而另一个则+ 
Li 1 J Li 1」 

M . «此.作实对称 矩阵和 y 对称矩阵之间 存在*很大的差別[见 （4. 4> 节]. 

24. 如栄 A 6 A 1 既是正规 矩阵. 乂珐幕零矩阵，证明 A -0. 

25. 设是给定的 拓阵. 证明. A 是正规矩阵，当 ft 仅当存在次数至多为一 1的多 

项式 〆 />，使得 / V =/) M >. 提示： 如果 A = diag ( A , •…， AJ , 用 Ugnmgc 插值法构造一个 
多项式使 〆 A >= A ， 然后引用 （2. 5. 4). 这进如何“说明”为什么一个正规矩阵与它的伴随 
可交换的？此外 • 如果 A 是实矩阵、证明使得 /V =/> ( A > 的 Ugnmge 插值多项式 〆 •>有实系 
数且 / \ T = p ( A ). 因此对实正规矩阵 A 有 = 其中 〆 •>是实多项式.见 （0.9.11.4). 

20. 给出一个父正规矩阵的例子，它两相似于一个对角矩阵 • 但不实正交相似于一个对角 
矩阵.证明，实矩阵 A 实正交相似于一个对角矩阵 • 3 FL 仅当 A 是对称矩阵 （A = A r ). 

27. 证明，已知矩阵是正规矩阵 • 当且仅当对所有 j *, v 6 C W 

( Ar >. ( Ay ) = (AV (. A - y ). 

从几何上看，这表示对所有 * r , yec \ Ar 与 Ay 之间的夹角等于 A ，. r 与 A .. V 之间的夹角. 
这与习题1是什么关系？ 

28. 如果是正规矩阵 • 证明 • .4 r = 0. 当 ft 仅当 A*.r = 0. 这表明 A 的零空间与 
/ V 的零空间相同.考察口 L 和 D =，说明这对一般情形不 成立. 


29. 假定有线性方程组 A_r = > 其中，和>€0："是已知的，且假定 A 是奇异矩阵. 

所给定的方程组有（非唯 一的） 解 • 当且仅当对每个使2 = 0的 Z 6 CT [见 （0. 6. 6)] 有式允之= 
0. 可是，如果 A 是正规矩阵，便可证明，所给定的方程组有解，当且仅当对每个使 = 0 
的 W ，6 C " 有 3 ^ u ；= 0 ; 即： y 正交于 A 的零 空间. 如果想求奇异方程组 Ar = ： y 的所有解，说明 
为什么在计算上 A 是正规矩阵时的求解比 .4 不是正规矩阵时更简单. . 

30. 设 《,,〜，•••， 〜是给定的正整数，且 , > = 1, 2, k . 证明，直和 A = 
A ,© A 2 ㊉ … ㊉ 是正规矩阵，当 R 仅当每个 A , 都是正规矩阵. 

31. 证明，两个正规矩阵相似 • 当且仅当它们两 等价.提示： 证明，如果 C ； 和 V 是两矩 
阵，那么 （ ML ； •和 VAV •西 等价. 给出一个例子，说明两个（非正规）矩阵相似，但不西等价. 

32. 如果八6^3(10是实正交矩阵，我们知道， A 要么有一个，要么有三个实特征值.如 
果它有一个正的行列式，利用 （2. 5. 14) 证明它正交等价于 [ l ] eM , 与一个平向旋转的茛和，从 
几何上 讨论， 可把这矜作绕某条经 K 3 中原点的固定轴转动0角的 旋转. 这是关于力学的 Euler 

_ 定理的一 部分： 每个刚体运动是一个平移与一个绕某条轴的旋转的合成. 

33. 如果夕是正规矩阵的交换族，证明存在 Hermiter 矩阵仏使得对 每个人 

都有次数至多为1的多项式/ >•(/) 使人应当指出，《对于 叉的所 有元索是固定 
的， 而多项式可能与5的元家有关 • 提示： 设 L / eM „ 是同时对角化夕的每个成员的两矩阵， 
设 B ， l / dia g ( l ， 2，…，”)[；•， A 4 = UA q U ' ,其中丄 = diag ( Af , …，心， ） ，然后取/» 〆 /)是 
使/々^=1，2,…， /!• 的 Lagrange 插值多项式. 

34. if •明，是正规轵阵，当且仅当 A 的每个特征向 M 也是 A •的一个特征向 M . 提 
示： 设是西矩阵，它的第1列是 A ( W 而是>的一特征向检验 LT A 17 和 LT A . L / = 
aJ'AW ,然后继续做下去. 

35. 当>\， BeM n 是出规矩阵时，证明 （2. 2. 8) 的下述 改进： A 酉等价于仏当 fl 仅当 

tr 2, 提示： 利用习题15以及（1， 2) 节习题 12. 

36. 设 AeH ,( IO , II 假定 AA r = A 7 A , 因而 A 是实正规 矩阵. 如果 AA T 的特征值各不 
相问，证明 A 必须是对称矩阵. 提示： 利用定理 （2. 5.8). 

2.6 QR 分解和 QR 算法 

为一个给定的矩阵 A ^ M n 提供一种 Schur 西上三角化 （2. 3. 1>的特殊计算方法，以及（在 
某些假设下）计算特征值的一个通用的数值方法， 称为 QR 算法， QK 算法基于一般矩阵 A 6 
从.,„的所谓 QK 分解. 

2.6.1 定理 （ QK 分解） 如果那么存在有标准正交列的矩阵•和上5 
角矩阵尺6从"，使得 .4 = Q / e . 如果” 那么 Q 是西矩阵：此外，如果 A 是非奇异矩阵 •, 
则可以选取尺为具有正对角元的上二•角矩阵， 并且 在这种情形，因子 Q 和 K 都是唯一的.如 
果 A 6 M _( R )， 那么 Q 和 K 都可以取实矩阵. 

证明： 如果且 rank A ==，/!，则 A 的各列构成 C ，， 的一个无关组，把 Gram - 
Schmich 过程（0.6.4>应用于 A 的各列 • 用矩阵记号描述所得结果正是 A 的 Q 尺分解 . Gram 
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Schmidt 算法的 H 然推广使同样的矩阵记号描述能够应用于 A 的各列可能是相关的一般情形. 

设4 = 写成了以它的列为子块的分块形式.如果 fl | =0, 令仏=0;否则令_ 

q x = aj { a ； a x ) m - 对每个 A = 2 , 3，…，/«,如同在通常的 Gram - Schmidt 过程中那样，算出 

力 = “* 一 2 山 *• 

••■1 

如果它成立，当且仅当是…，“ 2 , …， …-，的线性组合），则令 w =0; 否则令 w = 
y k ny ； y k ) {, i . 这时，向董％ ，…， 〜是正交组，其中的每个元素或者是单位向 M ，或者是零 
向每个向 tt % 是《,，…，屮的线性组合，反过来，上述做法保证每个列屮是心，…，％ 

的线件组合.因此存在纯# ~使得 

> 

Oj = 2 r */^** _> = 1 ， 2,… ， w. (2.6.2) 

*-1 

如果对所有々>«;•, 令％ =0,而对于所有使 v ,=0 的每个 i , 对所有 ）=1, 2,…，7/2,令 r ,,= 

0,那么，经过上述过程，上三角矩阵和向被仍，…，〜由“，，々，•••， 

‘所 确定. 矩阵，… • 〜]•有正交列（其中有些可能是零），因而 （2.6.2) 表明 

A = QR . 

如果 nmkA = m ， 则 Q 有标准正交列，因而所要求的分解形式巳经得到•特别地，如果川= 

«，且 A 是非奇异矩阵，那么，根据 （2.1.4 e ), Q 必须是西矩阵，而非奇异矩阵 R = CT A 的诸 
对角元必须是非 零的. 在这种情形，因为要求 K 是上三角矩阵，故％是的纯 M 倍数，并 R 
对于彳= 2， …， 《，％位于这样一个一维空间内，它在由 《,,•••, c /, 生成的空间中是…， 

〜^生成空间的正 交补. 因此，除了差一个绝对值为1的比例因子以外，每个％是唯一确定 
的. 于是用 Y = diag ( | / r„, …， I I 代替 K 以及用 Q，sQ diag( ni / | r n | , 

…， "_/ I r _ I > 代替 (？， 便给出唯一的分解 A = Q ' iT , 这正是定理的叙述中所断 言的. 

如果 A 的各列不是无关的，取由 Q 的非零列组成的（标准 正交〉 组，然后把它 扩允为 C 的 
- •个标准正 交基； 用上述方法得来的新向 M 记作，…，、.现在，用 2 ，代替 Q 的第1 
个零列，用心代替第2个零列，如此做下去，直到所有零列都被这种方式所 取代； 用 Q ' 表示 
所得到的矩阵.因为 Q ' 的新列与 K 的零行相对应，于是 Q ' 有标准正交列 ， KQR = Q f R . 因此 
A = Q f R 是所要求的分解式. 

如果 A 是实矩阵，注意到所有必要的运算都可经实的运算来完成， 因而所 得到的因子是 

麵 • □ m 

练习如果 A 6 M ".„， 且证明， A 可以分解成 A = LP ， 其中，是下三角矩 
阵，而具有标准正交行；至于其余的论断，这个分解有与（2.6.1〉相平行的叙述. 

练习证明，任一个形如 A 的矩阵（其中都可以写成衫=/丄•，其 
中是具有非负对角元的下三角 矩阵. 并证明 • 如果 A 是非奇异矩阵，那么这个分解是 
唯 一的. 称这个分解为 B 的 Chdesky 分解； 每个正定矩阵都可以按这种方式分解（见第7 章〉. 

提示 ：写出 A = QR . 

Q 尺分解有重要的数值意义[例如，（2.6.3>],然而作为一种理论方法，它间样是有价值 
的. 例如，已知矩阵 A 6 M ” 经两相似的上三角化，可以直接从它的通常的相似上三角化得到. 
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如果 S iAS =* T 是上三角矩阵，且如 （2.6.1) 中， S — QR , 那么 KW AQ 尺= 7 J 1 CT AQ = 
RTK 1 ， 而它作为上三角矩阵的乘积仍是上子角矩阵.用同样的方式可以推出，有关同时二.角 
化的定理，例如 （2. 4. 15)，实际上是同时丙三角化 定理. 这就是说，如果中的某个矩阵族 
可经相似同时-角化，那么它同样 SI 经丙等价同时=角化. 

下而，不加证明地叙述 i | •算特 征值的 QK 算法，汴简要地说明它的某些特性. 

2.6.3 算法设 已知. 写出 A a = Q 、, i ?,， 其中 Q . 和札如 （2. 6. 1 ) 所示，然后定义 
Ai = R , Qc . 冉写出 A — Q ^,， 其中 是?? 矩阵，而上三角矩阵，这样继续做下去，一 
般地，如果因子山 = Q t M , 就定义山 

练习证明，用 Q 尺算法得到的每个 A * 两等价于 A u , A = l , 2,…. 

在某些怡形（例如，如果九的所有特征倌有+同的绝对悄），当々 - OC 时， CW 迭代值 A , 
将收敛于一个上三的 矩阵. 因为这个上三角矩阵两等价于 A ,,. 所以的各特征值便 被计算 
出来. 

如果人是实矩阵，迭代 ffiA * 可以通过实的运 W •来汁算.如果 A u 有非实特征值，那 
么就不能指望迭代 m 会收敛 r •—个卜.二•角 矩阵. 这 ffiw 为这个上二•角极限必须是实矩阵. 
_ 不过，在*些怡形 • " f 以选取迭代值 / W , 使它们收敛于一个 1 X 1 和 2 X 2 主对角子块的 
实分块上 7 •角矩阵.而出现 这种悄 形的允分条件是，除 r 各个成双成对的非实赵共轭特征值有 
相1"1的模以外，人的所打实特征值都有不同的模. w 为分块二•角矩阵的各特征值适诸对角子 
块特征值的集合之并 • 所以九的特征值®作为 QR 迭代悄的分块二 ffj 极限的 1 X 1 对角元 
以及该极限的 2 X 2 对角子块的特 M : 值 （ 的复共轭对 > lW 出现的，它们可以很容易地用实 数运裨 
和」次公式计箅出来. 

2.6.4 例 下述例子说明 • （?/《算法不一定总收敛于一个二.炻 珩阵 .设 

于是， cr ( A > = <±/ h 特征值没有不的模.如果这个 W 法的一个可能的序列是 



另一个是 

A,，=A 七 "]= 

在这两种情形都出现了循环，因而序列彳 A *} 不收敛于上二•角矩阵.何是，存在彳丨的一个选 
择，它收敛于一个分块上7角矩阵. 
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习题 

1. 设 a 是 C ” 中的给定无关向 M 组，且设假定对向量 

々，•••，心实施（0.6.4〉中所描述的 Gram - Schmidt 过程得到杯准正交组 2 ：, •…，^且设 2 三 
L~I —Z„J 6 ( a > 对々=1，2，…， " I , 设 2* = 0,22 … ：山 *|〜 2 … *r 顯]， 其中 2* 是经 

Ciram - Schmidt 过程的第々步而得到的单位向 W , 因而乙= Z . 证明， Z , = XA , , Z , = 
乙 △:，•••， Z ,, = 乙 丄,，其中，每个△.都是非奇异上三角矩阵， 而厶 =/ +—个除第/列以外其 
余各列全为零的上一角矩阵. （ h ) 设么， 6=1, 2, …， 说明 7； 是上- 角矩阵 a 
Z * = XT t , k = \, 2,… ，川. 设丁 Wifii Z = XT . ( c ) 矩阵与定理 （2.6. 1) 证明中的上 
气角矩阵尺之间的相系是 什么？ < d > 证明 ， iij = k \ 1, d 2, …， m , 和 T , 的前々列 
不会变动，闪此. Gram - Schmidt 过稈的第/:步就产 1:. M 终得到的矩阵 Z 和 T 的第 々列. 

2. 设 a •…，&是 C " 屮治定的线性无关闷镦组.乂设考虑下面 
的算法: 

I . 令 ZsX , 且记 2 f =[>, •••'], 一开姶先让每列1=1,… • //!. 

[ I . 对 A -1, 2,…，"，，实施以 F 代 换：. 

(i ) tt 先，列 A 用 ? *> |: 代衿： 

( II ) 对 ）= ^ + 1 ,务+2•…，" I ，每列 c , 用 t 一<5,， n >2* 代转. 

我们用丧示 C _ 上的普通内枳. U > 证明这个过程的最后结果是矩阵 Z 具有标准 
正交列，它与习題1中用 Gram - Schmidt 过程得到的矩阵 Z 是相同的.(1)>若 2：* 表示该算法 fr : 
第々步中止时矩阵2：的存储信息， k =\, 2. // I , 证明厶 =. W , Z ，= Z , A ,, 厶 = 

.乙，、’ iX ; 这电，每个△，是一个作•上~角8«:阵，«形式 tt △，—/ +—个除第/行以外 K 余各 
行全为零的上7角矩阵 • < c > 设7\三 △: A : …丄. 々—丨 • 2•…， m . 注意到 T , 是上-角矩阵， 
Ifii Z k ^ XI \. (=1，2•… • m •证明树个7\的前々列与习独丨 中矩阵 7\的舫々列足相|司的， 
即使 △* 和么可 能各不相同 .& T = T m . ( d > 证明 ， Mj = k +\, k +2, // i , Z , 和厂 的前 

々列不乞殳动 • W 此该算法的第步就产生 M 终得到的矩阵2：和7•的; fU 列.这个 W 法称为修 
改的 Gr ^ m-Schmidt 过程； 它通过 S 新调整计算得到与通常的 Gram - Schmidt 过程相同的结果. 
ffi 然修改的算法与通常的 Gram - Schmidt 算法在数学上是等价的,但是对于数值计算来说，修 
改的 G ” ani - S 4 mid t 过程更受欢迎 • W 为它需要的存储较少 • ft 遇到的某些列接近平行这样 
一些难题 fii , 它冶助卞构到一 个能箅 出的 Z . 这个2：的«列要比用通常的 Gram - Schmidt 算法 
得到的/史抆 B •于正交.在遇到难题时可以方便地通过列旋转策略使它的性能迸一步改 进：在 
实施步骤 H ( 丨 >之的，首先选作 A 的是一个余下的列 c ,， j ^ k . 其长度的平方大.在 
数值 计算中污一步（不要求 反演） 实际上得到 A , 1 •然后累枳这些 W 子的 乘积可以计算 . Y 的 QR 
分解中的5角因子. 

3. 说明如何用一系列由 Householder 变换组成的乘积来实现 QR 分解.证明上述过程必项 
用 《—1 个 Householder 变换来完成，且 Q 是这些变换的乘积.一般认为，这个方法在计算上 
优于 （2. 6. 1>证明中所采用的 Gram - Schmidt 算法. 

*»• 如果应用于的0尺算法收敛于一个上一角矩阵，可以怎样计算 A u 的特征向 M 
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呢？ 提示： 需要解一个右边也是零的（奇 异） 三角形方程组. 

5. 设将 QR 算法应用于某个矩阵且设是 Q 尺迭代值的 序列. 如果序列收敛， 
且用选择原理 （2. 1.8>仔细说明为什么 B 酉等价于 A . 这为什么是重要的？ 

k •w. 

进一步阅读关于 Gram - Schmidt . 修改的 Gram - Schmidt 以及几个其他的正交化过程的另 
外的参考资料和详细的叙述，可参看 [ GVI ] 的 pp . 146-169. 关于 QR 算法和证明方法，以及 
另外的参考资料可见由 D . Watkins 写的综述 ， “Understanding the QR Algorithm , f , S/AM 
[llH Rev . 24(1982), 也可参看 [ Ste ], 427-440. 


3.0 导引 


第3章标准形 


在什么情形下两个矩阵是相似的？我们知道，相似矩阵有相同的迹、行列式、特征多项式 
和特征值，然而例子 



(3.0. 1) 


说明. 两个矩阵的上述四个可以分別相等，但它们却不相似.假如存在某个非奇异矩阵 S 6 
使得 A = 'sSOS '=0, 那么， W 为 A #0 而得出矛盾. 


练习计箅 （3.0. 1>中的两个矩阵的迹，行列式 • 特征多项式和特征值.证明 A 2 =0. 

W 为两个看上去很不相 N 的矩阵仍然可以相似，所以，一条确定两个矩阵是否相似的途径 
设想冇某个 H 有指定形式的“简中矩阵的集合，然后狞这两个已知矩阵是否可以通过相似 
化成这些“简单”形式中的一个.如果它们能做到，那么它们必定是相似的 （ W 为相似关系是传 
递的和对称的）.什么样的“简单”形式能符合这个要求呢？ 

毎个 fi 矩阵 A (西>相似于一个上三角矩阵.它的对角元 ( A 的特 征值〉 可以按任一给定的次 
序 （2. 3.1) 排列，因此，如果两个矩阵相似于同一个上三角矩阵 • 那么它们就是相 似的. 不过， 

两个 H 有相同主对角元和不同的非对角元的上角矩阵仍然可以相似.这样一来，如果已经把 [ TT 9 
两个已知矩阵化成两个具有相同主对 角元的 不相等的三角矩阵，还不能由此得出这两个矩阵不 
相似的 结论. 这里有相当大的灵活件：为 r 识别是否相似，在一个角矩阵中有《(,,+丨）/2 
个非岑元 （更确 切地说“未必是零"的元）滞要考察，这个数 R 太大 r . 关 f 这种三角矩阵 • 没有 
唯一的 形式. ^ 

如果说上 H 角矩阵类与所要求的形式相距 甚远， 那么对角矩阵类乂如何呢？如果两个已知 
矩阵中的每一个都各相似于一个对角矩阵，那么，它们彼此相似，当且仅当两个对角矩阵有相 
同的对角元，其中相 . K 对角元按重数计算而无需考虑它们的顺序.其理 由是： 可以用1相似矩 
阵 PDP 7 按任 意规定的次序给出对角矩阵 D 的主对角元. S 然这解决了讨论上三角矩阵时所 
涉及的 唯一性 问题， 然而， 现在还有一个存在性 问题： 不是每个复矩阵都相似于一个对角 
矩阵. 


练习证明 （3.0 •丨）中的矩阵不能对角化. 提示： 如果 A = \那么 A = 

如果对每一个矩阵来求一个尽可能接近对角矩阵的上三角形式，而 R 还可用相似变换得到 
它，那么所得结果是 Jordan 标准形，这正是下一节要讨论的内容. 

我们已经考虑过两个矩阵 A ， 的相似性，在矩阵理论中还存在其他有意义的等价 
关系. 例如， A 是否可以经酉相似或者只应用初等行和列的变换变成如果 A 和 B 都是实 
矩阵，是否可经一个实相似使 A 相似于如果/\和召是 Hermite 矩阵，是否存在一个非奇 
异矩阵使得如果 A 和 B 是对称矩阵，是否存在一个非奇异矩阵 At 



使得 A = SBS ' 

作 L 述每一个例子中，在一个矩阵集合上有一个等价关系，而我们对每两个矩阵是否在同 
一等价类屮感兴趣，解决这个问题的途径是，求一个具有规定形式的代表矩阵的“简单”集合， 
它们各取自每个等价类中的一个矩阵.我们试图把每个已给矩阵化成它们中的一个.如果这一 
方法果 M 凑效， 那么每个等价类实际 I :必须包含规定形式的一个代表矩阵（这在相似下对于对 
角矩阵集合是不成立的>,而且 AI 好在每个类中 R 有一个代表矩阵（或者设想有一个由等价类的 
Q 20] 代表矩阵组成的较小的且容易描述的集合 >( 这仵相似下对于上？角轵阵集合是不成立的）.这 
样一个出代表矩阵组成的集合常常称为标准形 • 仵本章里，要考虑几个标准形.在后儿荜的部 
分段落还将引出其他标准形. 

3. 1 Jordan 标准形：一个证明 

Jordan 标准形 坫一个 “近乎对角”乐•阵的集合 • 称为 Jordan 矩阵 • 它包括对角矩阵 . 
Jordan 矩阵具有 性质： 每个（在相似下的> g 方阵的等价类包含一个 Jordan 矩阵，并 fi 按一种 
W . iWW 见的方式使得在同一个等价类的任 意两个 Jordan 矩阵本质 h 玷相同的.一个与已知矩 
阵相似的 Jordan 矩阵称为该矩阵的 Jordan 标准形（或者有时也称为 Jordan 法 式）. 只要知 ifl •了 
一个矩阵的 Jordan 标准形 k 耶么关于该矩阵（即线性变换 > 的所打线性代数的佶息一种就淸 
楚了 • 

丄 1 •丨定义 Jordan 块人 U ) 是指具有 形状: 

• A 1 0 

A 1 

•/〆:•）= j ••• (3. 1.2) 

'• 1 

0 A 

• —J 

的 fx 々上三角 矩阵. 在上 / r 角线上有▲一丨项 “ + r : 纯 tt a 在主对角线上出现々次.其他所 
有元索都是零，且人 （ A > =「 A ]. —个 Jordan 矩 f 车是诸 Jordan 块的一个直和 



其中，各阶数/ I ,可以相同，而值 A , 末必不同. 

应指出的是，如杲 （3. 1.3) 中的每个 Jordan 块九 （ A ,) 都是一维的，即，所有％ = 1且々= 
… 那么 Jordan 矩阵 J 是对角 矩阵. 如果 （3. 1. 3) 中的任一 Jordan 块 J „( A ) 有 w > l 那么 J 不 
仅不是对角矩阵，它甚至不能对 角化. 假如人 = 是对角矩阵，那么必须有 A = 

- 1211 diag ( A , A , A )= A /. 于是九 1 ~ A / = A /~ A /= 0, W 而如果，/；>】，这种情 



形+会出现.相应于每个申独的 Jordan 块，都有 J 的一个特征向量： 它是属 于*/中每个 
. UA ) 的第一个对角元的标准基向 

本节的主要结果是，每个复矩阵都相似于一个实质上是唯一的 Jordan 矩阵.我们将通过 
H 步来得到最终的结论. 

第一步注意到每个复矩阵相似于一个上〒角矩阵，它的诸特征值按一个规定的顺序出现 
在主对角线上；这正是 Schcur 7角化定理 （2.3. 1>. 

第二步然后证明，一 个上三 角矩阵蚵经相似变换成一个分块对角矩阵，其中每个单独的 
对角子块的所有对角元都相等[像 Jordan 块 （3. 12> — 样].这是定理 （2. 4. 8>. 

第三步觭后证明.-•个其主对角元都相等的上三角矩阵相似于若干 Jordan 块 （3. 1.2) 的 
直和. 

只要证明了最后一个结论，就吋以通过 fi 合每一步所必：的相似变换将任-复矩阵化成 
Jordan 标准形. 

另外，我们也注意到以下负 实： 如果一个轵阵是实的，且仅有实特征值，那么可以用实相 
似把它化成 Jordan 标 准形. 为此，我们想到了 （2. 3. 1 >,那足说，如采实拓阵 A 只冇实特征 
值.那么存作-•个实西（实正交）矩阵 L 7, 使得 L / M 17 S 上三角矩阵，因而它只冇实元索.此外 
( 2.4.8>的证明说明，如果上二•角矩阵 A 是实的，那么存在一个实相似矩阵使得 AS 是 
一个（实）分块对角矩阵 • 其中 • 每个 对角子 块足上 H 角矩阵， M 都 K 冇相等的主对角元.因 
此， 余下只需要证明第 H 步足可以实现的；汴[1，如果从一个 ft 冇相同的实主对角元的实上三 
角矩阵开姶实施变换，耶么，把它化成一个 Jordan 块的打 和的相似珩阵坷以取实矩阵. 

证明第 三步是 "〖以实现的过程中 • " K 述引理是冇 川的. 它的证明其实就是 H 接计算. 

3. 14引理设々>1是已 知的. 且假定有 Jordan 块 


J t (0) = 


那么 

T 厂0 0 

y *( 0 ) j *( o >= • 且如果/> > 则人 （ok = o . 

L0 /*i- 

另外， A ( 0 ) 〜,， /=1，2，…，々一 1 ， fl [/- J * T (0) J *(0)] x =( j - V , ) e x ,这里，/ 1 _, e 
H > 是单位矩阵，^是第/个标准单位基向蛾.且^60. 

现在证明， 第三步 中的简化总是坷以做 到的. 我们知道一个严格上三角矩阵是其主对角线 
上只有零元的三角矩阵.同时注意到一个具有相等主对角元的1：二:角轵阵是单位矩阵的一个纯 
M 倍数加上一个严格上三角矩阵. 

3.1.5 定理 设 AGAt 是严格上二•角 矩阵. 存在一个非奇异矩阵 S 6 M ， 和整数 a ， W2 ，… 
" m ， 其中 S Wi +七 +…+ /!„ = «，使得 
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■•(0> 


0 


A = S 


( 0 ) 


S 


(3. 1. 6) 


0 J % (0) 

如果 A 是实矩阵，则矩阵5也对以取实矩阵. 

证明： 如果《==丨 ， A = [0]， 结沦是明敁的.对 w 作归纳法，且假定对阶数小于《的所有 
严格丄三角矩阵，结论已经证明.把 .4 块分成 


.A 


•0 a T l 

•0 A,」’ 


其中，且 A , ,是严格上二•角矩 阵. 根据归纳假设，存在非奇异矩阵 
使得 S / Aj , 有所要求的形式 （3. 1.6): 即 

' 0 




*， 


0 


0. 


L 0 


(3. 1. 7) 


| J ? 3 J 其中…>夂>1 ， 十 h + …+夂，"一1 ， 人=人(0>,且 

01 


0 


6 


注 意到* /中没有一个对角 Jordan 块的阶数超过 A , • 所以， 根据引理 （3. 】.4>, =0. 砰简单 

汁箅可知： 


I 0 

•0 s, 


W : 


« 7 s , 


]• 


使分块与 <3. i .7> m 右边的分块相一致；即， c , ee . ,且 
(3. 1.8) 写成 


(3. 1. 8) 
，然后把 


I 0 
Lo S , 

现在考察这个矩阵的下述相似 矩阵： 

a!Jl 


S , 


n 

0 a ! 

a ] 

= 

0 八 

0 


0 0 

J . 


0 

•0 

_ 0 

0 

_0 


0 

0 


0 



0 a { aV 


1 aJJl t O' 


0 J *. 0 


0 I 0 


0 0 J _ 


.0 0 /_ 


— Jl'h 

aj- 


'0 

(a[ e t )el aj ' 


0 


0 

八 0 

0 

J . 


_0 

0 J - 


(3. 1. 9) 



标准形 


89 


其屮，用到了引理 （3. 1.4> 中的恒等式现在有两种可能性，这取决于 
aff^i ^0还是 afe ^ O . 

如果那么 


l/a 1 , e x 0 0 

0 / 0 

0 0 (\/aJ 

0 e { al 

0 ；*, 0 

0 0 / 


0 ( afe')el a ] 

0 八 0 
0 0 / 


Je , 0 0 

0 I 0 
0 0 aJ e . 


•J etajl 
-0 J J 


注意 




,.( 0 ) 


祜一个 H •布零主对角线的怂 +1 阶 Jordan ^. 利用性质 j ~= c , ,= 1, 2,…，容易证明 

-0 / 」Lo J J !.0 / U J 

iJ e.aJj-] 

= Lo y 

然后可以递归地计算一系列相似的矩阵 


•/ 

■0 


■ r ； 

.Lo j 」 



[J e.najj 1 ! 


Lo j J 


air 


~ e t ， iajj' 1 1 
LO / 
i — 2,3, …. 

W 为/ •==()• 我们看出，仵这一系列相似的矩阵中 fi 多经心步便可使非对角子块变为零•因 
此得出， A 相似于矩阵 


V . 


它正是要求的严格上-角 Jordan 矩阵形式. 

如果 de ,=0, 那么 （3.1.9) 说明， A 相似于矩阵 

•0 0 aV 

0 J kl 0 

J ) 0 J . 

而它乂置换相似于矩阵 

ry *, 0 0 

0 0 al 

. 0 0 J • 

根据归纳假设，存在非奇异矩阵 *. ， 使得： 


(3. 1. 10) 


JB 



是一个具有零主对角线的 Jordan 矩阵.因此，矩阵（3.】. 10), 从而 A 本身相似于 



它就是所要求的 Jordan 标准形式，只是诸对角 Jordan 块可能+按非增的顺序排列.若有必要， 
经一个分块罟换相似便可得到所要求的形式. 

鉍后.我们看到，如果 A 是实矩阵，那么 在这 个证明中所采用的所有相似矩阵都可选为 
实的，于是经过一个实相似， A 便相似于所要求的 Jordan 矩阵. □ 

为 述立起 Jordan 标准形，定理 （3. 1. 5> 实质上完成 f 所约定的程序的第三步.我们注总 
到，如果 



是所冇对 角允 都等于 A 的上三角矩阵， flK 么， A P = A — A / 适严格上三角矩 阵. 如果是 
• II : 衍异妒阵.11 S : A tl S 钻由 （3. 1. 5>所确保的若干个基本 Jordan 块九 (0) 的一个 ft : 和，则 
S ' AS-S MuS + Af 是若干个基本 Jordan 块入 ,（ A > 的0； 和. 在 (2. 3) 节中实施的第一步和第二 
步连同第三步恰好证明了 F 述 Jordan 标准形定理的存在性 部分： 

3.1.11 定理设饪已知的韃 矩阵. 则存在非奇异矩阵 . SeAf ,, 使得 

Jn, (At ) 0 

A J.AXz) 

八 = s • • S l = SJS (3.1.12) 

0 j . k ix k ) 

且， I , +，，:• + …卜" * = w . 如果不计各对角 Jordan 块 的排列 顺序， A 的 Jordan 矩阵是唯一的.特 
征值1，/•=】，2， •••• 々，不一定不相同.如果 A 是一个仅有实特征值的实矩阵，那么相似矩 
阵 S & 了以取实矩阵. 

证 明： 除 r 唯一件外.其余的论断都己 证明. 如果4, G 6 M ,, 相似，则对子任一纯 WA 6 C 
和任意指数2， …， 矩阵 （ A — A / 广和 — A / 广也相似；特别地，它们的秩相等•因 
此， H 需证明，位亍 Jordan 矩阵对角线上的一组 Jordan 块（包括相®的 子块） 可由有限 
多个幣数訓 kU — A / r 完全确定，其中 W = K 2. …，"， Aecr ( J ). 

首先考虑形如 （3. 】• 2) 的一个 Jordan 块 7*(/,) 6 M , 的情形，其中是给定的且,”>•】. 
如果"纟0，则 rank 人 （户） ’” = rank =务，因而 ran k 人 （户） ” 一 ran k 人 （"） w4 丨= 0. 如果 



其次，设是形如 （3. 1.3> 的 Jordan 矩阵，又设并旦对于 m = l , 2•… • 

定义 r ^ A ) 三 rank(J — A /广 ；且令 r t . ( A ) 二 w . 从前述关于一个子块情形的分析可知，差 ‘（ A ) = 

匕丨 （ A ) — r w ( A ) 等十 J 中所有阶数々彡 w 的诸 Jordan 块 J * ( A ) 的总数，且对所有 m > n 有 
cJ llt U )=0. 因此， J 中恰好是阶数的诸 Jordan 块的个数等于卜尤 .,（ A > = r ,„ ,( A )~ 

2 r „,( A ) + r w+ ■ ( A ) ，其中 w = 1 ， 2 ， •" • ”• □ 

练习设有 Jordan 标准形 J ， 设 AMA 的一个特征值，其代数重数为 v ， 乂设乂 
表示 J 中阶数为 々的 诸 Jordan 块 J *( A ) 的个数，其中々 = 1，…， w . 如果当 w 彡1时。 （ A ) ^ 
rankCA - A /)"* 而 r 0 ( A )= w ， 证明: 

( a > r „«( A ) 和满足线性方程组 

n 

( A ) = ，/ 一 1/ + 2 ( I 一 "I >6 ,， /W = 0 ， 1， ••• • w 一 1 • 

( b > 该方程组有唯一解 .（ c ) 其解为乂 =〜 ,( A >-2 r 麟⑴ + / Vh ⑴， m = l , 2, •••• w ， 其 
中 | ( A ) = r B ( A ) = ;i — y . 

为了有 Jordan 标准形的•个标准表示 （3. 1. 2) ,我们约定选取 A 的各不相同的特征值 A , , 

Am …， A * 的某个顺序，并 R 首先给出相应于 A , 的所有 Jordan 块； 然后是相应于 A 2 的那些 
Jordan 块，如此等等.相应 f 每个不同特征值的漭 Jordan 块，按递减（非 增〉 的顺序绐出 ， ff 
先是 M 大的了•块，随后是仅次于 般大的子块， 等等.因为，相应于同一特征值的多®同阶子块 
M 完全相 M 的， 所以. 一 S 给定了诸特征值的顺序，这个表示就给出了个唯一确定的 Jordan 
标准形 . 中的矩阵的毎个相似等价类包含一个 fL 只包含一个这样的 Jordan 标准:形. 

ifl 然推导 Jordan 标准形的过程是一个明确的算法 • 它原则上可以用来计算一个已知矩阵 
的 Jordan 标准形，但是绝对+能指望川计 ff 机对它动实施数值计算.令人遗憾的亊实是， 

使用计算机不仅可能得出虚假的结果，而且实际上并没有一个计算 jordim 标准形的稳定的数 
值方法.这只要举一个简单的例子就清楚了. 

如果 A = D 且那么 AtSJiS / 1 ， 其中 S = 且人如果令 

e — 0,那么，•/« —〔=, rW 它不可能是非零矩阵人=|^ □的 Jordan 标 准形. #实上，八，有 

I U 作为它的 Jordan 标 准形. W 为一个矩阵的 Jordan 形未必是该矩阵的各元紊的一个连续闲 

数，可能有这种情形，一个矩阵的各元的一个小的变化会引起 Jordan 标准形的各元的一个大的变 [\'27] 
化.不能指望用稳定的方法计算这样的对象.因此在数值应用中，儿乎没有用到 Jordan 标准形. 

尽管有这样的 M 限性， Jordan 标准形还是值得认真了解的 • 它为透彻理解矩阵提供了丰寓 
的 源泉. 作为一般的技巧，当我们要证明矩阵的有关结论时，不妨先考虑能否对对角矩阵证明 
这一结论.如果这是可行的，那么就（利用任一复矩阵可以用一个可对角化的矩阵任意接近的 
事实） 看一看某个极限论证是否可以一般地证明该结论.如果这不见效，或者想避开分析 论证. 

那么下一步便可设法对上三角矩阵或 Jordan 矩阵宋证明这一结论. 

每个矩阵都相似于形如 （3. 1. 12> 那样的矩阵，其中，诸 Jordan 块中的所有项“+1”郤用 



e 关 0 代替， e 可以取任意小的值.了解这一点有时是有用的. 


3.1.13 推论设46从是给定的复矩阵，乂设 e >0 是已知的.那么存在一个非奇异矩阵 S = 
S ( e )6 M w , 使得 

人, a " e > 0 

.. 一. . 


A = S 


S', 


(3. 1. 14) 


(A*,e) 


- f - ••• -I n k = n 


e M m . 


nn 


如果 A 是只具有实特征值的实矩阵，那么 S 可以取实矩阵 • 

证明： 首先求非奇异矩阵使得 S / AS , 是 Jordan 标准形（如果 A 是实的，且只 
有实特征值，那么取实 S ,). 然后取 D |= diag ( l ， e , e 2 , …， 6"') , 再计算 
这个矩阵具有形状 （3. 1. 14), 于是 S = S ( c ) = S , D , 符合定理的 要求. 口 

习® 

1. 用详细的计算来证明引理 (3. 1.4). 

2. 试用 （3. 1. 1丨）的证明中的三个步骤，求 


[I !] ^ ? 


— 〜 L 0 0 3」 

Jordan 标准形. 

3. 设 AeAt 是复矩阵，但只有实特征值.证明 A 相似于一个实矩阵，相似矩阵可以选取 
实矩阵吗？ 

进一步阅读定理 （ 3. 1. 11 ) 的证明思想取自 R . Fletcher and D . Sorensen , “An 
Algorithmic Derivation of the Jordan Canonical Form , n Amer . Math . Monthly 90 (\ 9 S 3 ) y 12- 
16,文中另有参考文献. [ Ste ] 从数值计算的观点讨论了 Jcrnlan 标准形，并丘给出了例子说明 
矩阵的元素产生扰动时其 Jordan 标准形的灵 敏度. [ Str ] 提供了•-个好的证明. 

3.2 Jordan 标 准形： 若干论断和应用 

3. 2.1 Jordan 矩阵的结构 Jordan 矩阵 


•,( A 2 ) 


+ = n (3. 2. 1. 1) 


(A*) 
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有一个确定的结构，它使得该矩阵以及与其相似的仟一矩阵的某些基本性质变得更加明显. 

1. Jordan 块的个数 H 相同的子块计重复出现的 次数〉 是 J 的线性无关特征值向 M 的个数. 

2. 矩阵 J 可对角化，当且仅当々 


3. 相应于一个已知特征值的 Jordan 块的个数是该特征值的几何 重数. 它是相应的特征空 
间的维数.相应于一个已知特征值的所有 Jordan 块的阶数之和是该特征值的代数重数. 

4. 知道了诸特征值以及它们的代数承数和几何重数 • 一般不能完全确定一个 Jordan 矩阵. 
我们还需知道相应于每个特征值的各 Jordan 块的阶数，相应于一个特征值 A 的最大 Jordan 块 
的阶数是 A 作为其极小多项式的一个根的策数 （3. 3.6). 


5. 相应于某个特征值的诸忉^抓块的阶数可以通过计算某些幂的秩来确定.例如，如果 
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和 （J 一凶此，我们知道 
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U -2D 6 = 0, 

rank( J — 2/) 2 = 1, 


I:n 


rank( J — 2/) = 4 , 

(7-2/) 是 8 X 8 矩阵 • 

这组数足以确定 J 的分块结构.事实 t，U — 2/ P =0 说明最大+块的阶是 3. (J — 2〖) 2 的秩 
就是3阶子块的个数，因而只有一个3阶 子块 . （J 一2/>的秩是3阶子块的个数的2倍加上2 
阶子块的个数，因而有两个2阶子块 •• 1阶子块的个数是8 — （2 X 2) —3=1. 可以把同样的手 
续应用于具有仟意阶数的若千 J 0 r d an 块的直和， 只® 它们是相应于同一个特征值的所有子块. 
如果•/是相应于特征值 A 的这样一个直和，那么使 （ J — A /)*， =0的 ft 小幣数 t 便是最大子块 
的阶数. ( J - A /)*' 1 的秩是 t 阶子块的个数 ， （J 一 A /〉*，— 2 的秩是怂阶子块的个数的2倍冉加 
上々，一丨阶子块的个数，如此 等等. 对于,= 0，1, 2 ,…， (J A /灼 1 的秩序列递归 
地确定出 J 中所有子块的阶数. 

6. 在一般的 Jordan 矩阵 （3. 1. 1. 1) 中的所有 Jordan 子块的阶数可以通过分析某些 幕的秩 
来 确定. 如果 A , 是 Jordan 矩阵 J 6 M , 的特征值，那么，当我们取幕 （J 一 A,/K ( J ^ A ,/) 2 , 
…时，只有相应于 A , 的诸 Jordan 块会变 成零， 因为 J — A , /中的其他子块都有非岑对角元.最 
终 ， （J \/广的秩将 ff 止卜降（不必考察任 --々> w >; 使（•/一 1 />* 的秩达到它的极小值的那 
个 W 小的々值是相应卜 A , 的 ft 大 Y 块的阶.这个极小值称为特征值幻的指 标. 对 （J 一 1/) 的 
各次幂组成的序列的秩进行分析，就足以确定相应于&的诸 jcrnlan 块的阶数与个数，然后冉 
对 A 2 , A 3,等等作同样的分析，因而确定出所有的子块. 

ft 然上述各个论断 是针对 Jordan 矩阵 J 作出的，然而，每一个论断也同样适用于任一相 
似于 J 的矩阵 . W 此，如采 Li 知轵阵耶么 A 的 Jordan 标准形 （ 不是把/\变换成 
Jordan 标准形的相似 > 可以通过下述步骤来 确定： 

1. 求出/\的所有不 N 的特 征值. 或许这可以通过求特征多项式的根来办到. 

2. 对 A 的每个不同的特征值 A .. 作 （A — A ,/>*， 其中 A=K 2，…，《，然后分析这些矩阵 
的秩所组成的序列便可石出/\的相应于特征值 A , 的所有 Jordan 块的阶数与 个数. 

这个算法对于手算一些简单形式的小矩阵可能是有用的，但是用计算 机汁算 就可能失效， 


W 为确定一个矩阵的秩的过程本来就是一 个不 捻定的 过程. 例如， = 1就可以使我们 

矜清这一点：对所有 e 关0, A , 有秩2,但对 e =0, 它有秩 1. 

例如，这个算法在下述情形是有用的，假定有这样一个问题 • 要确定 Jordan 块人 （0)6 
M k 的平方的 Jordan 标 准形: 



0 



0 


0 

0 
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A 的各特征值都是零 • 对川=[(々+〗>/21 =(々七丨）/2的幣数部分， .4^=0, 而如果 p = l ， 2，…， 
川一丨，则尹 0. 对于/»=1，2，…， m -2、 每个幂的秩比它的前一个幕 V 的秩少 2. 
如果 A 是偶数，则 A ' f 有秩2，|«如果々为奇数，则/ V *— 1 有秩 1. 因此 ， A = 的 Jordan 
标准形是 

「 J” （ 0> 0 I 

， 6 = 2/«是 偶数； 


以及 



k = 2 m — 1是 奇数. 


这一结果对于确定一个已知矩阵是否有平方根是有用的. 比如， 它说明不存仵使 A 2 = 


3.2.2 常系数线性微分方程组在理论上要意义的 Jordan 标准形的一个应) H 是分析常丨;[到 
系数微分方程绀的解.设是已知的，且考虑一阶初值问题 

•/(/>= Ar ( / ). 


• H 0) =儿 M 已知的， （3.2.2. 1) 

其中 j (/)= Lr ,(/)，.!•:•（/) •… • ^(/)] T . FI 撇6('> 表示对/ 微分. 如果 A 不是对角矩阵•则 
这个方程组 * 耦合的：即 aG ) 不仅与 』, w ) 打关 • 而且还与向 «■!•(/> 的其 他分 fi 有关.这种耦 
合悄形使问题变得椎以解决 • 似足.如果珂以把 A 变成对角（或近乎 对角） 的形式，那么耦合 
的影响可以减剌，或荇托至可以消除， 因而坷 以很容易地求解.如果 Z = .SAS >,其中_/是 A 
的 Jordan 标准形，那么 （3. 2. 2. 1) 变成 

〆 (/> = Jy ( t ), 

y ( 0 ) = v u M 已知的 • （3. 2. 2. 2) 

其中 o * ⑴ = 々 (，)，fl y 0 = S - l T 0 . 如果可以解出问题 （3. 2. 2. 2), 那么 （3. 2. 2. 1 >的解的毎个 
分嫩就是 （3. 2. 2. 2) 的解的诸分 M 的一个线性绀合，且这个线性组合是由 S 给出的 • 

加果 A 是可对角化的 • 那么 J 是对角 Si 阵，且 （3.2.2. 2>正好是 一个形如/⑺ = Aou (/) 
的非隅合方 稈组， 它有解 h (/) = h (0> 〆 *、 如果特征值 A , 是实的，这是一个简申.的幂，而如 
果 / U=w + /h 是复数，它则是一个振动项 >(/>=： y *(0 V ，[ cos (/ V >+，\ si n (/ v >]. 

如果•/是非对角的，解就® fi 杂了. 相应于 J 中的不 M Jordan 块的； y (0 的诸分摄是非耦 
合的， W 此只要考虑 J 是单独的 Jordan 块 

A 1 0 

J = • • e 

•. 1 

0 A 

的情形就可以了.方程组 （3.2. 2. 2>是 
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Xy t (/) + W >， 
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: y 二 1(0 = A ^^,(/)+. y M ( r ), 

y m it)= A_y 朗⑴， 

它可以由下往上直接求解.从最后一个方程幵始 • 得到 

ym(t> = ym(0)t^ , 

于是 
它有解 


y w -,(/) = A >„.,(/) +3» m (0) 〆 . 


A - 〆 /) =%(()) 〆 +.、•,（()> 〆 ， 
于足可 以把它用于下一个方程，它变成 

)〆 《 2(/> = Xy m *(/) +)■-(())/〆4-^_,(0)^ 

它有解 


如此 等等. ffi 然解的每一 . t •分 !* 具有形式 

>*("== 〆 /"(/>• 

其中％(/>是次数至多为 m — l 的多 项式. 

从上述分析可以知道， W 于仔… 给宝的初始条 件，， • 问题 （3. 2. 2. 1) 的解 * r ("的各个分楙 
有形式 


j ..(/、 =々,（/> 〆 • + />:•(/) 〆 :’十…+ /»*(/) 〆〆 ， 

其中 Ai ， A :，• A * 足/\的不朽的特征值， 心每个 p ,(/) 是多项式，它的次数严格小于相应于人 
的最大 Jordan 块的 阶数. 头特征值产生纯指数项，而复特征偵可以产生混合指数和振 动项. 


3.2.3 矩阵与它的转置的相似性每个 Jordan 块置换相似于它的转置， W 为从相似性可以矜出 
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0 A. 


1 0 


0 1 A 


因此 • 如果是已知的，旦 A = «SJS 1 是它的 Jordan 标准形，那么， A 相似于 J ， 
相似于 J f ， J r 乂相似于 / \ r = ( S r ) ' J r ( S r >. 结论是，每个复矩阵相似于它的转置.由此推 
出，一个复矩阵的行秩（线性无关行的最大个数）等于它的列秩（线性无关列的最大个数 >，这是 
凶为 秩足相似不变设.同时也推出，/\和有相同的特征值.不过，直接作出所有这脒推论 
也是比较容易的. 

对任意的域 F ， 情形也是这样， A ^ UF } 中的每个矩阵都可经的一个矩阵相似于它 
的转罝；且不必假定 F == C . 实际上，相似矩阵可以取为对称 矩阵. 



3.2.4 交换矩阵和非减次矩阵 如果/ >(/> 是多项式，而是已知矩阵，显然 p ( A ) 与 A 
可交换，这是一个有用的 事实. 可是反过来乂如何呢？如果 A ， 是已知的，且 A 与 B 
可交换， B 必定是关于 A 的多项式吗？当然不是这样， 因为 如果取 A =/, 则 A 与每个矩阵都 
可交换， p (/> = />( l )/ 不可能产生任何非纯 M 矩阵.问题是 A 这一形式使它能与许多矩阵可交 
换，但又只允许它产生少数 形如 〆 A > 的 矩阵. 为了得到这方面的任何结果 • 必须寻求协调这 
两种能力之间的关系的某个折中办法. 

3.2.4. 1定义矩阵叫做非减次矩阵，是指 A 的每个特征值有儿何重数 1. 

因为 Jordan 矩阵的一个特征值的几何重数等于相砬于该特征值的 Jordan 块的个数，所以， 

一个矩阵是非减次的，当且仅当相应于每个不同的特征值恰好有一个 Jordan 块. 例如， 如果 
有 h 个不同的特 征值. 或者 A 只有一个特征值，而该特征值有几何重数1,那么它是 
非减次的.纯 M 矩阵不是非减次矩阵 . 

3.2.4.2定理设楚给定的非 减次 矩阵.矩阵.与 A 可交换，当且仅当存在一个 
次数至多为 《—1 的多项式 〆•）使得 B = p(A). 

证明： 如果朽耶么《 - 定与 B 可交换.关于逆命题，设 A = 1 是 A 的 

Jordan 标 准形. 如果 BA = AB ， 那么 1 =SW B 且 （S 1 ( S 」 RS ). 如果能够 

iiH 明 S 、 BS = p(jU 那么 B = l ) = p ( A ). 因此，只要假定 A 本身就是一 [135] 

个 Jordan 矩阵就可以了. W 为 .4 是非减次的，所以可以假定 

入(幻> 0 

A = • , 

參 

o W 

其中 A ,， A:， …， A , teA 的々个不同的特 征值， 如果把 B 写成与 A 的上述形式相同的分块形 
式 h = ( 从; ） ， 那么 A B — B A 的相应非对角 子块具 有形式 

J ' ( A . J / i .) — B 0 J ( A , )=0, f 9^ >. 

W 为特征值 A , 和 A , 坫不同的.山此可以得出[见（2.4> 节习® 9], 是这些方程的唯-•解， 

W 此矩阵 B 必须是分块对角矩阵 

0 

B = •. , 

參 

.0 

其中每个 . 交换性假设是说，对于所冇/=〗， 2. …，々，有 = ( A ,) 认.如 

果记九 ( A ,)= A ,/ + N ,, 其中 

$ 

•0 1 0 ! 

參 

N , = 

•• I 

0 oj 
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那么这些恒等式变成 = 1=1, 2, k . 直接计算可知，由于 N , 的特殊形式每个 

B , 必须是具有丁(^ ? 1^形式（0.9.7)的上三角矩阵.即 

b\ iy b \° … W 

b\ n : 

B , = ， (3.2.4.3) 

0 •• •吹、 

b \'\ 

其中沿普各对角线的 m 元素取常值.如果珂以构造出一些次数至多是，/-】的多项式 a(/> ，a 
[1361 具有性质:对所有|»， P . (九,（\)>=0而 A ( A , a )) = B ,， 那么 

pit ) = pi (/) 十…+ /»*(/> 

将满足定理的论断.定义 

k 

q ,( t ) = JJ (/ — A ,)"/ . q ,、 t ) 的次数 =n — n ,, 

I 幻 

由此可见，对所冇有 V , (人 ( A ,)> = 0, 这是 W 为（人 A ,/>* V =0. 44 然％ (九不 
一定等于 a , 可是它14非夺异 i 阵 （ w 为 « a . 是各不相同的）， fl . 像关于九的任 i 个多项 
式那样，具冇形式 （3. H 3). 

W 为形如 （3.2.4. 3> 的任一非 夺异矩 阵的逆具有同一形式，乂因为这种形式的任意两个矩 
阵的乘积还是这 N —形式 • 所以矩阵 

[ v , (九 . a >>] •«, 

足 n 行丁(邱1^形式（3.2.彳.3>的上三角矩阵，每 t 这样的矩阵可以写成 关于人 ( a ) 的一个多 
项式.例如 

认= «，》 （九 • a ) ―人/广+《"（*/•. a >- A , n _ + … a>-*u 广 • •• 

W 此，存在一个次数至 多是％ —〗的多项式 r,(/>, 使得 

[W,,a)>] 1 = /*. ( 九 ,a)>. 

如果现在令 pAt ) = q . U ) r . U ), A (/) 的次数至多是 W _ 1. 

/ >,< i ^< A ,)) = V ,(人 ,（ A ,)> r , (人, U ,)> = Or ,( J , ( A ,)) = 0， 

如果，尹_；，则 a (人 a ))= v , (九 . u ,>)= b ,. □ 

定理的逆命题也 M 样成立， W 而导•出非减次矩阵的一个 特征： 轵阵是非减次的， 
当 M 仅当每个与 A 可交换的矩阵是 A 的-个多项式. 

3.2.5 收敛矩阵矩阵 Ae / W ” 如果冇具 性质： 当讲—如时， A ” 的所有元索都趋于零， 就称 A 
为收敛 矩阵. 这样的矩阵在数值线件代数的算法分析中起着策要的作用.如果 A 是对角 矩阵. 
那么显 然有： A 收敛，当且仅当 .4 的所有特征值的模都严格小于1，并且同样的结果可以推广 
到可对角化矩阵. 

由于涉及极限运算，如何运用扰动理论把这一结果推广到未必是对角化矩阵的一般情形是 
HU 不明显的.但是，可以利用 Jordan 标准形，如果 A = •是 A 的 Jordan 标准形，那么 = 

SJ'\S 因而，当 oo 时当 a 仅当 woo 时广 —0. 因为 J 是洛 Jordan 块的直和， 
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所以只要考虑 Jordan 块 



= A / -f N * 6 ,其中 / V * = J *(0) 

的各次幂的性质就坷以广 W 为，对所有 W =0. M 


= ( a / +/ v *)- = = 2 Of 

对所有的々成 Sr . 因为各对角元都为 a _, 如果广 — o , 则必定这说明 U I < 1 . 
反过来 • 如果 UI <1, 我们想证明， 对片个 ）= 0, 1, 2,…， k-u 


当"!一火呀 ，! ) a - ; — o . 

、 m — j f 

然而, 

= I 1 )(/.，一 2 >•••( "， 一 j | DA 1 " I ^ I m , X " > 

一 i ；U 卜 |>!A ; f 

W 此，只要 证明当 m — OC 时 fTm 梦够广孖出这个关系的一个简单办法是取对数, 

灯 41 注意到. W 为 log 丨 A | < 0 . 义根据 1 / Hopital 法则 • $ oo 时（ 1 0 以>" 4 0 ,所以当 
m > 00 时 • 



7 log m + y/ilog I A I - oo. 

上述证 法主要 足利用 A 的 Jordan 标准形来证明，当 "/> oo 时冇/\_一0,当且仅当 A 的所 
有特征值有小于1的模•另一个证明将在 （5. 6. 12>中给出.它根本不依赖 jordan 标准形. 


3.2.6 几何重数-代数重数不等式 轵阵 A 6 M .. 的一个特征值的几何币:数坫 A 的相成于该特 
征值的 Jordan 块的 个数. 这个数小于或等于相应于该特征值的所有 j or dan 块的阶数的和•这 
个和是代数里数.因此一个特征倌的儿何觅数不大于它的代数 亟数； 试与 （1.4.9) 比较. ^38) 

3.2.7 可对 角化矩阵和幂零矩阵 一个矩阵.46%是幂家的，是指对某个正整数々，有 
代一 Jordan 块人 （ A ) 可以写成人 （ A >= A /+/ V *， 其中， （/ V ,>*=0. 因此，任一 Jordan 块是一个 
对角矩阵矩与一个幕零矩阵的和. 

更一般地，一个 Jordan 矩阵 （3.2.1.1) 可以写成 J = D + / V ， 其中 f ) 是对角矩阵，它的主 
对角线与 J 的主对角线相同， n.N = J - D . 矩阵/ V 是¥零的 • 且只要 A 是 J 的錢大 Jordan 块 
的阶，就有 M =0. 

最后，如果 AeM " 是任一给定的矩阵，社 A = S 7 S -| 是 Jordan 标准形，那么 A = SDS 丨 
+ SNS 其中/ \ D 可对角化， Av 是幂零的，且这是因为 D 和 /V 

都是具有相应的同阶子块的分块对角矩阵•且 D 的诸子块是纯量矩阵. 

我们得出，任一 可以表，: K •成一个可对角化矩阵与-•个幕零矩阵的和，且这两个被 
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加矩阵可交换. 

习题 

1. 设>={.4。： 是给定的矩阵族.且附以指标集 y , 乂假定存在非减次矩阵 

A,,e >. 使得对所有 《 e ,/, 有疋九,=束人.证明，对每个都存在一个次数至多为 //— 】 
的多项式 />/(> 使得 A a =/>,( A 。〉， 因而7是一个交换族. 

2. 设是已知的， A , 是 A 的一-个特征值.证明 A 的相应于特征值 A , 的最大 Jordan 
块的阶数 U , 的 指标） 是使 rank ( A — A ,/)* = rank ( A — A ,/)*" 的走=1, 2，…，”一 I 的最小值. 

3. 如果对*个 A 6 M ,, 有 A *=0, 证明，对某个 r < w ， 有因此每个幂零矩 
阵有一个次数不大于其阶数的等于零的 提示： 证明0是 A 仅有的特征值.想一想 A 的 
Jordan 标准形是什么样子？冉取幂. 

4. 设人 （0) 是一个已知的 Jordan 块.试利用 （3. 2. 丨 ） 末尾的证法确定矩阵（0> 的三种可 
能的 Jordan 标准形. 

[ D?l 5 - 设 AeM, •是 w 零矩阵， w 而对菜个々有 .v=o. 证明， a 的特征多项式是/»,、（/>=/". 

6. 作用在次数至多为3的全体多项式所组成的向埴空间上的线性变换 d /山： p ( n - p，uu 
在基 XI , /, /:• / 3 >下有基表示 

■0 10 0 ' 

0 0 2 0 
0 0 0 3 * 

•0 0 0 0 . 

这个矩阵的 Jordan 标准形是什么？ 

7•使 A 3 = / 的矩阵的各种可能的 Jordan 形袪什么？ 

8. H 冇特征多项式/>“，）= (/十3 广 一4) 2 的矩阵 A €： M g 的各种可能的 Jordan 标准形是 
什么? 

9. 试用 （3.2. 1>中所叙述的方法确定 



的 Jordan 标准形 • 

10. 试证定理 (3. 2. 4.2) 的证明中的 沦断： 形如 （3.2.4. 3>的两个矩阵的乘积有同一形式.冉 
证明一个形如 (3.2.4. 3>的非奇异矩阵的逆有同一 形式.提示： A 的逆是一个关于/\的多项式. 

11. 设 A , B ^ M n 9 试用定理 （1.3.20) 的证明中的恒等式证明， AZ 3 和的 Jordan 形屮 
的各非奇异子块是恒 等的. 这能说明 AB 与 R 4 相似吗？如果与不相似，讨论这与它 
们能够相似有多大差別. 

12. 假定 A " …， A ★是已知矩阵，其中， A , 6 M , , i = l , 2, — , k , 乂假定 J ,， …， J * 
是它们的相应 Jordan 标准形.证明直和 


• A , 

0 


0 

6 ， ri) f n 2 + … + 71* = w 

A, 




(除 了差诸对角子块的一个排列 以外） 有 Jordan 标准形 

01 

I U 
! 0 ••• 


和 B ， 


是已知的•证 明， 直和 de 


相似于 s 和「1 二 

— vy I. 


当 a 仅当 b 相似于 c . 

14. 设 B , 是已 知的，证明， A 次直和 


B (T 



•c 0 

B 

6 ^ 

L 与 

C 

0 ••• 

B. 

0 '• 

- C. 


相似，当 IL 仅当 B 与 C； 相似. 

15. 设和衫， CeM. 是已知的，证明，直和 

01 .4 0 

B C 

„ . e m ‘与 

o ••• o ••• 


6 , k ^ 1 


相似，当 H 仅当 K 与 C 相似. 

16 •设有 Jordan 标准形九 ,（ A ,> ㊉ … ㊉ 如果 A 是非奇异形矩阵，证明 A 2 
的 Jordan 标准形飪、 Uf ) 任)… ㊉ 人 4 ( Ai ): 即/ V 的 Jordan 标准形恰好由与 A 相同的一组 
Jordan 块组成，只是相应的特征值要取甲 方. 与此类似的结沦对所有幂 A * (02) 成立吗？举 
一个 2 X 2 的例7•说明，如果 Z 是奇异矩阵，上述结论不 成立.提示： 如果试证 WU ) 
的 Jordan 标准形（一个 Jordan 块） 是人 （A : ). 冉证明，如果 A 关0， 

rank [ y *( A ) - A/]" 1 = rank [人 2 U) - A 2 /]，， w = 1，2,…，々 

17. 如果 AeM ”， 证明 ， rank A = rank A % 当 且仅当 特征值 A ==0 的几何重数与代数重数 
相等•即/\的 Jordan 标准形中相应丁 • A =0 的所有 Jordan 块（如果有的话）是】 X 1的. 

进一步阅读一个给定的矩阵与其转置间的相似变换矩阵总可以取为对称矩阵.该亊实的 
证明可参看 0. 1 aussky and H . Zassenhaus * “On the Similarity Transformation between a 
Matrix and Its Transpose /* Paci/iV J . Math . 9(1959), 893-896. 在 （3. 2. 4) 节末提到了定 
理 （3.2. 4 .2> 的逆命题也成立，其证明可见 [ HJ ]. 


3.3 多项式和 矩阵： 极小多项式 

如果/>(/) = 〆 +«* 〆 x + a k - 2 t k ~ 2 
M „, 可以定义 


… + A / + CI 。 是给定的多项式，那么，对于任 一 A 6 


I4T 
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p(A) 三 A * + I A * 1 十“卜. 2 .4* 2 十… + 〜 A 十 ％ /. 

在多项 AS 矩阵之间存在一个重要的相互关系.我们已经论述了特征多项式的重要作用，但是 
还有其他一些与一个方阵相关联的多项式，其中之一是极小多项式. 

(:町一七抑山 01 1定理<2.4.2)确认，对每一个存在一个 n 次多项式（特征多项 
式）/>“/)，使得 / M (/>=0. 说一个多项式零化 A , 是指它在 A 的值是0矩阵，也可能有零化 A 
的"一 1次多项式，或《—2次多项式，但是很明显，因为只存在有限多种可能性，所以，对每 
个 A 6 M ,， 有一个零化 A 的次数最小的多项式，且它的 鼓小次 数至多是《.如果 〆 A >= o , 
那么对任 一 r 6 C ， cp ( A )=0, 显然，总可以规范化一个非零的零化多项式，使其最高次项的 
系数是 + 1. 加果一个多项式的 M 卨次数有系数1，就说它是首一多项式，应指出的是 • 一个 
芮一多项式不可能恒等于岑. 

3.3.1 定理 A 6 H , 是已知矩阵. 则仅冇一个零化的次数 M 低的首一多项式 ^(/). 这个多 
项式的次数至多 fi % 如果 />(/) 是使/>(/\) = 0的任一多项式，那么，^(/)必除尽 />(/>. 

证明：特征多项式 足芩化 A 的一个 例子. 它是 W 次多项式，于是存在次数为的首一 
_ 多项式(/(/>，使得 yA >= o . 如果 />( n 芩化 A , awns •芩化 A 的次数 ft 低的苜一多项式， 
W 么 </( n 的次数必蜊小十或等 f 的次数 • 闪此，根据 Euclid 荞法，存在多项式 / K /) 以及 
次数小于 g (/) 的次数的多项式 r (/>, 使得 pU )= q ( t ) h ( l ) + rU ). 但是0= />( A > = g ( A >/ iM > + 
r ( A ) = 0/ i ( A)-f r ( A ), W frti r ( A ) 0. 如采 r (/>，0, 可以把它规范化，从 ifli 得到一个零化 /A 
的 ifU 次数小于 />(/> 的次数的 ft —多项式.因为这与 〆 />的极小性相 矛朽， 所以得出 r (/)-0, 
Wifu ( /( n 除尽 />( M ， 如架有两个芩化 A 的次数 M 低的 n —多项式，上述论证说 
明，每一个部除尽另一个； W 为它们的次数相 N ， 所以其中一个必须是 另一个 的一个纯撖倍 
数. 然而，它们都是首一的，纯撤 W 子必须是+〗， WrfS 它们是恒等的. □ 

3.3.2 定义设 A 6 M ,, 足已知矩阵.零化4的，次数 M 小的唯一 tt 一多项式^(/)称为 A 的 
极小多项式. 

3. 3.3 推论相似的矩阵冇 相同的 极小多项式. 

证明： 如果 A ， B ， S 6 M ., 且 A = ，，那么， q u ( A )= g b ( SBS * 1 ) = Sq l( ( B)S 1 =0 

于足的次数+小十^(/)的 次数 . H S '. AS , 所以间样的论证说明 (/ A (/) 的次数不 
小于(/ 〆 />的次数.因此，这两个 t 一多项式有相同的 fi 低次数且都零化 A ， 于是根据定理 
(3.3.1)，它们必须 恒等. □ 

3.3.4 推论对于每个 A 6 M ”， 极小多项式除尽特征多项式此外， ^ (A) = 0 , 当 
M 仅当 A 是 A 的特征值，因而/>.4(/)=0的每个根是^</)=0的根 • 

证明： W 为由定理珂知，存在多项式使得这个分解 
使我们看到， w (/)=0 的每个根是 />. A ( n =0 的根，因而^(/>=0的每个根是 .4 的特征值.如 

果 A 是 A 的特征值，且 * r 关0是相应的特征向域. flR 么•且 0 = w ( A)i = w ( A ) x ， 冈此 
^( A ) = 0. □ 

这后一个推论说明，如果把特征多项式完全分解成 


• T 43 
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p.\(t) = JJ(/—A,)'** 1 ^ s, ^ & 十 s 2 + … + = w ， (3. 3. 5a) 

i-i 

其中 A ,， A 2 ，…， A ,， 各不相同.那么极小多项式 w (/> 必须有形式 


= JJ (r — A , ) r * . 1 ^ ^ (3.3.5 b ) 

原则上，这给出了一个求已知矩阵 A 的极小多项式的 算法： 

1. 首先，假定通过求特征多项式以及对它做完全分解，计算出 A 的各个特征值和它们的 
代数重数.设法确定分解 （3.3.5 a ). 

2. 在 （3.3.5 b > 中，有冇限多个乘积形式的多项式，从所有 r , = l 的乘积 开始， 通过直接验 
算，确定零化 A 的， 次数最 低的多项式.这就是所求的极小多项式. 

从数值汁算考虑，这 不是一 个好的 箅法. 因为对于一个大矩阵 • 要牵涉到分解其特征多项 
式的问题.似是，对于手 W —些形式简单的小矩阵的极小多项式，它可能是很冇效的. 


练习 


设 A= L 


,求 A 的极小多项式 c / 4 (/). 


A 的 Jordan 标准形和 A 的极小多项式之间有畚密切的联系.假定 A = SJS 1 是 A 的 
Jcmkn 标准形， R 先假定 


r A 1 O ' 

J = • , eM H 

*. 1 

.0 A ； 

只是一个 Jordan 块. A 的特征多项式是 Q — A >", 乂因为如果 A < w , 则 ( J - A ” V 0, 所以极小 
多项式也 *(/ 一 AK . 如果 


人 U > 0 

j ^ e m” • 

0 J m ： ( X )\ 

其中那么 J 的特便多项式仍为</一 A )", 可是现在 （ J — A /)- 1 =0,并且没有较低的幂等 
于芩. N 此， 极小多$式是 (/ 一 AK ，. 如果有更多的子块，结果是相 M 的： J 的极小多项式是 
(/ 一 AK ， 艽中 r 是相应于 A 的最大 Jordan 块的阶数.如果 J 是一般的 Jordan 矩阵 • 那么极小 
多项式包含毎个不 h 特征值 A •的个因式•且 r , 一定足相应于 A , 的最大 Jordan 
块的阶数：没有®低的¥可以零化相应十 A , 的所冇 Jordan 块.并且也+需要更卨 的柹 . W 为 
相似的矩阵有相同的极小多项式，我们已经证明了下述 定理： 

3.3.6 定迓设是已知矩阵 • 其不同的特征值是 A ,, …， A … A 的极小多项式是 


A ，厂， （3.3.7) 

其中 r , 是 A 的相应于特征值夂的最大 Jordan 块的阶数. 

实际上，这个结果在计算极小多项式时不是很有用的，因为确定一个矩阵的 Jordan 标准 
形比确定它的极小多项式更难- .些； 况且，只要知 逍了一 个矩阵的诸特征值，它的极小多项式 
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可以通过简申的试凑法来 确定. 不过，有一个亟要的理沦性推论.因为一个矩阵可对角化•当 
且仅当它的所有 Jordan 块有阶数1,所以，在（3.3.7> 中，可对角化的一个必要充分条件是所 
有 r , = 1 . 

3.3.8 推论设 A 是已知矩阵，它的不同的特征值是 A ,， 心 ，…，那么， A 可对角化，当 
且仅当 V ( A )=0, 其中 

qit) = (/ 一 A |)(, ~ A : )•••(/ — 又 《)• (3.3.9) 

在确定一个已知矩阵是否可对角化时.这个准则是很实用的. W 为如果知道一个已知矩阵 
的特征值，就容易写出多项式（3.3.9〉.然后看它是否零化 A , 如果它零化 A ， 它一定是 A 的 
极小多项式 • W 为没有31低次的多项式能以/\ 的 / zi 个不同的特征值为根.把上述结果用下述 
几种等价的方式来表述，有时很有用. 

3.3.10 推论设是已知矩阵. T 列条件中的每一个都是 A 可对角化的必要充分 条件： 
( a ) 极小多项式有不同的线性因子. 

( I )) 的每个根冇承数 1. 

[145] ( c ) 对于使 w (/)=0 的所有根，导数 〆 A (/) vt 0. 

对于已知矩阵已经讨论了求一个芩化 A 的，次数 ft 低的宵一多项式的问题•然 
iru '. 关于它的逆问题乂如何呢？给定一个首一多项式 

= / N + a m -i t" 1 + “• a, 1 * 2 + … + ci|/ + “.• • (3. 3. 11) 

存 4:— 个矩阵 A 使徇 />( M 是其极小多项式吗？如果有，/\的阶至少必须为《父《;耍求这样一 
个矩阵 是不闲 难的.考察矩阵 



并且看到 

Ie { = e, = A u 。• 

At x = e 2 = Ae ，， 

At 2 = tr 3 = A 2 ti * 

Ae 3 — e x — A s e t . 

參 ♦ _ 

• • • 

• • • 

t = <\ = A ” V , • 

A 〜 =— a n { e m — a^ 2 e v , - u,e 2 — a it e } 

= \A n 1 e x — a” 2 A" 2 e x — •- — a, Af, — a n e x = A n e x 
=[ A ，一/>( A )>,. 


W 而 



标准形 
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p(A)ei = (a,，ei 十 a x Ae x 4- ei 2 A 2 e l -f ― +a._, ) + AV, 

= lp ( A )- A n '] e l 十 [ A " _ p ( A )>, = 0. 

另外，对每个々=1，2， •••• ”• p(A)e k = p(A)A k l e t =A k ~ l p(A)e ] =A t *0 = 0 . 因为对每个 
基向 Mg 有 />( Ah =0, 我们得知 〆 A >=0. 因此• 〆 /)是零化 A 的”次 首一多项式.如果 
存 在零化 A 的，且有较低次数 / w > w 的多项式 g (/> = r+/ v ,广1+…+ 6,/+ 心， 那么 

0= q ( A ) e ] = A ’ V | -+ b „ x A m V , + …十+ b^ex 
= e„^t -f 厶 *… + 厶 |<» 2 + — 0, 

它推出基向量〜 u 与基向 W ：^， c …，〜线性相关.因为这是不可能的，由此得出/ >(/) 是 
零化 A 的，次数 M 低的唯一首一多 项式. 另外，因为 p (/) 有 次数〜 A 6 M h9 且特征多项式 
/ M (/) 也是零化 A 的” 次首一 多项式，所以 （3.3. 11>必须是 （3. 3. 12) 的特征多项式. 

3. 3. 13定义矩阵 （3.3. 12> 称为多项式 （3.3. 11) 的友矩阵. 

已经证明 r 下述 定理： 

3.3.14 定理每个抟一多项式既是它的友矩阵的极小多项式，又是其特征多项式. 

稍后，我们将提出儿种不同的方法来确定包含一个矩阵的诸特征值的 区域. 因为一个多项 
式的芩点进其友矩阵的特征值，所以这些方法可以用来估计一个多项式的各 零点. 见（5.6>节. 

如果 A 6/ W " 足一个 已知矩阵，我们可以计算其特奸多项式 a 、（/ UU 及多项式/^(/)的友矩 
阵 （3.3. 12〉.如果 A 相似于这个友矩阵，那么 （ W 为相似的矩阵有相 M 的极小多项式），由 
( 3.3. M > pT 知， A 的极小多项式—定恒等于 A 的特征多项式/一般说来不会有这 
种悄况，不过，如果是一个其极小多项式 〜（/> 与其特征多 项式心 （/> 恒等的矩阵，那 
么/\的 Jordan 标准形一定恰 4 f 含有每个不同的特征值的一个 Jordan 块.每个 Jordan 块的阶数 
芩于作为 A 的特征 （极小 >多项式的-个枣点的相应特征倌的®数.但是，多项式仏（/)的友矩 
阵的 Jordan 标准形与 A 恰好有相同的 Jordan 块 结构， WiW 它必须与 .4 相似，这番论证就足下 
述定理的一个证明. 

3.3.15 定理矩阵 A 6 M ” 怊似于其特征多项式的友矩阵，3目.仅当 A 的极小多项式与特征多 
项式恒等. 

练习证 明，相似于 其特征多项式的友矩阵，当 M 仅当 A 是非减次矩阵. 

习题 

1. 设.4， B 6 M , 是幕零 矩阵，证明， .4 与 B 相似，当 fl 仅当>\和5冇相同的极小多项 
式，这在 M , 中成立吗？ 

2. 假定 AeM ” 是已知的 ， a A 的不同的特征值 A ,, 1，…， h 也是已知的.试用 
(3.3.6) 证明，极小多项式 （3.3.7) 可以用下述算法来 确定： 对每个,=1，2,…，，”，计算 
{ A ~ X . I ) 1 yk =^ l f 2, — , n . 设是使 rank ( A 、 的最小々值，这个数 
r , 称为特征值 A . 的指标. 

3•矩阵是暮等的，如果>\ 2 =九利用 （3.3. 10) 证明，每个幂等矩阵是可对角化 
的. 提示： 试证 /:’一/ = /(/ 一 1) 零化 A . 焱的 极小多项式是什么？如果 A 是三次幕等的（| = 


A ), 你能说些什么？如果 A 4 = A 呢？ 

4. 如果 A 6 R ， 且对某个々<«，有 V =0, 证明对某个有 A 〃 = 0. 因此，每 个幂零 
矩阵有一个其指数不大于该矩阵的阶数的等于零的幂. 提示： 如果/ 〆 零化 A ， 想-想 
(3. 3. 1) 关于极小多项式是怎么说的？ 

5. 证明 Gram - Schmidt 过程有下述应用，那就是，对于一个给定的矩阵 M ,, ,既不需要 
知道它的特征多项式乂不需要知道它的任何特征值，也可以直接计箅 A 的极小多项式. 

U ) 设映射了： C " 定义 如下： 对于任 一 A 6 R ， 把它按列块分成 A = …， 

ajx 设 T ( A ) 表示0：” : 中唯一确定的向 M , 它的前"个分贵是第1 列〜的 各个分 M , 它的 ”+1 
到2«个分撤是第2列的各个分斟，如此等等.证明，这个映射 丁是向 摄空间与 C "' 间的同 
构（线性的、 一 对一的和到上 的〉. 

( h > 考察中的诸向嫒 

v 0 = TU) ,vi = T( A) ,V2 = T(A ) , ••• ,i»* = T( A* )，•••， 

其中走= 0， 1 ，2， ••• ， w . 试用 Cayley - Hamilton 定理证明 ， {ub * v , * ― * 是一个相关组. 

( c > 把 Gram - Schmidt 过程按治定的顺序应用于向 ft 组{叫•功•…， tU 直到 产生第一个芩 
向《为止.为什么一定会 W 到一个零向嫩？ 

( d > 如果 Gram - Schmidt 过程在第/ •;；： 产生第一个零向世，证明务一 1是 A 的极小多项式的 
國次数. 

( e > 如果 Gram-Schmidt 过程产生向置 ooVq +oj Vi + … + cr * i v *-, =0* 证明 

1^' (ao Vo 十 aiM —• ••• + "> I ) = a u / 十 a ： A r + … + == 0, 

由此 得出， q A it ) = ( a , x r * + ••• + •是的极小多 项式. 为什么 a *—, 关 0? 

fi . 按习题 5 中 》：& 的 it 求 . nnii 十其:，分別求 G Q 2的极小多项式. 

7. 考察3 J]vaB -r J ,说明 AZ ; 和 fM 的极小多项式不一定相间.但 M 和 

/丄4的持征多项式是相同的说明恃征多项式和极小多项式 之间为 什么存在这一差別. 

8 - 设八 6 A 人，/=】• 2, •"• 々，且设仏 ⑺表示 每个人的极小多项式.证明直和 

卜 0 

A 烏 

A = 

• 

.0 A* 

的极小多项式是(/,◦>，％(/〉，•••，的最小公倍式.这个唯一的，次数最低的首一多项式 
可被每个 1(/) 除尽. 注 意， 上述论证给出了引理 （丨 • 3. 10) 的一个不同的 证明. 

9. 如果 AfiVf : 的特征多项式 /> A ( r ) = (/-4) J (/- f 6) 2 和极小多项式 ^(/) = (/-4 ) 2 (/-f 
那么的 Jordan 标准形是什么？ 

J 0 * 用直接计算证明，多项式 (3.3. 11 》 是友矩阵 （3. 3. 12) 的特征多项式. 提示： 利用余子 
式汁算行列式. 




11. 有时，多项式 （3.3. 11) 的友矩阵定义为 


-一 h 

1 

—心2 … 

0 … 

— « o " 

0 


0 

參 

1 

• 

0 _ 

參 

0 

1 ••• 

• 

參 

• 

1 

0 - 

或 

參 

參 

0 

L — a u 

• 

• 

• 

• 

0 1 

… — 


证明，这两个矩阵与 （3.3. 12) 有相同的 性质： （3.3. 11) 既是该矩阵的极小多项式，乂是它的特 
征多项式. 

12. 说明，不存在其极小多项式为 〆 十丨的 3 X 3 实矩阵，但是存在 ft 有这一性质的一个 
2 X 2 实矩阵及一个 3 X 3® 矩阵. 提示： 利用（3.3.4〉. 

13. 里然相似的矩阵有相 问的 特征多项式和极小多项式，说明 .4 阶或更高阶的两个矩阵可 
能有相同的极小多项式和特征多项式而它们不 相似. 提示：考虑 


•0 

1:0 

0 


■0 

1 

i 0 

0 

0 

o o 

0 

和 

0 

0 

i 0 

0 

0 

0 ； 0 

l 

0 

0 

.:•••••• 

j 0 

0 

•0 

o i o 

0. 


.0 

0 

0 

0 


说明4是这种悄况可能出现的 Jft 低阶数. 

14. 如果 A , 是相似的，而/>(/>是一个多项式，那么 />( A )=0 当 H . 仅当 

试用前一个习题的例子说明，即使 A 与 B 不相似， p ( A ) = 0 当 R 仅当 〆 / j )=0 也可能对毎个 
多项式/ >(/) 成立. 为什么会出现这种情形？ 

15•设是已知矩阵 • 且设 = /»(/) 是一个多项 式}. 说明 PM ) 是从 

的子空间， H •它还是 iW ” 的子代数 「 P ( A ) 在乘法下封闭] • 证明的维数是 A 的极小多项式 
的次数. 

16. 如果 A ， 冇相同的特征多项式和相间的极小多项式， 且它 们的极小多项式与它 
们的特征多项式相 N , 证明 A 与 B 相似.冉利用这个 ，实 证明，关于习题9中所提到的友矩 
阵的其他各种形式都相似于 (3. 3. 12). 

3.4 其他标准形和分解 

除了 Jordan 标准形以外，还有儿种其他的矩阵分解，它们可以用于各种不问的情形. 

当矩阵 A 只有实元素时，首先考虑 Jordan 标准形 （3. 】• 12) 的一个变形.这时，所有的非 
实特征值必须成共轭对出现.此外，如果 A 是实的，那么 ra ,, k ( A — A />* = ran k ( H )* = 
nmk ( A — A /)* 对所有 A 6 C 和所有（=1，2,…成立，因而 • 相应于任一特征值 A 的诸 Jordan 
块的结构与相应共轭特征值 X 的诸 Jordan 块的结构相同.因此，相应于各非实特征值的所有 
阶数的全体 Jordan 块（不仅仅是1 X 1子块）成相 N 阶数的共轭对出现. 

例如，如果 A 是实矩阵 A 的一个非实特征值 • 且以某个确定的重数出现在 A 的 
Jordan 标准形中，那么 A U >也必须以相问的 M 数出现.分块矩阵 



A 1:00. 
0 A ： 0 0 


r J 3 (A) 0 1 0 A j 

- 0 J 2 (A)J~ 0 oi 


0 : A 1 

0 ! 0 A, 


(交换其第2,第 3 行 和列） 置换相似于 


A 

0 

1 

o- 

0 

A 

0 

1 [DU) 

0 

0 

A 

o -L 0 

0 

0 

0 

A 


du ) = A -le / e m ->. 

- 0 A J 


■•般 地. 任一形如 


「 J * U ) o 1 
- 0 J *( A)J 


的矩阵都置换相似丁•分块矩阵 

r D(A) 


D(A) 

0 


e m 2 " 


D(A)j 


(3. 4. 1) 


(3. 4. 2) 


其中 主对角线上冇 A 个子块 D ( A ), 而存: J ： 对角线 t 存6—】个 2 X 2 单位矩阵 
LOU SD(A)S 1 : [一: ^]= C ( a ,6), (3.4.3) 

其中 A = « 十泌，“， beR , 且因此，每个具有非实 A 的共轭 2 X 2 J 0 rd an 块的 

子块（3.七1)经^$ 相似于一个 rt 有形状 

-a b \ 10 

-b u \ 0 1 rCiaJ?) I 1 


0 0 
0 0 


-C(urb) I ■ 
- 0 C(a ， b) • 


的 1 X 1 实分块 矩阵. •一般 地， 每个具有非丈 A 的共轭々/幻 0 1^311块子块对（3.4.2)相似于具有 
形状 • 

c(u，f?) I 0 

. C ( M ， h ) ••• 




(3. 4. 4) 


Ciu ， h) 





的 M X 2 々实 分块矩阵.这些论述导出了实 Jordan 标 准形. 

3. 4.5 定理每个实矩阵尺)相似于具有形状 
[C- ia x ,b x ) 


C 〜 （£/ 2 ，厶2 ) 


c' ia ，， b p 、 


(3.4.6) 




L 九刘 

的分块对角实矩阵，其中，对于々=1, 6…， A *== w + i 匕是非实特征值， a 和心是实数， 
而夂，…， A , 是 A 的实特 征值. 每个实分块天角矩阵（:％(“*， 6*) € M 2 '具 有形状 （3. 4. 4)，且 
对应于 A 的 Jordan 标准形 （3. 1. 12>中具有诈实 A * 的一对共轭 Jordan 块九 • ( A .), ] Hk ( A*)e 
M " t . (3.4. 6) 中的实 Jordan 块 （ A*) 恰好铎 （3. 1. 12> 中具有实 A * 的 Jordan 块. 

我们 Q 经从一个实矩阵的一 g Morc ^ r 标准形 （3. 1. 12> 推导出它的实 Jordan 标准形. 
这样处理的优点是，它正好说明实 F 块 C \(〜， 数和个数与 A 的复 Jordan 块结构是什 
么关系.但是这样处理的 M /, 是，把 At 涣成 （ 3. 4. 6) 的相似矩阵可以选取实矩阵这个亊实是 
不明 M 的. 

V 实上，如果/\是实矩阵，那么总有一个非奇异的实矩阵 S ， 使得 S 1 AS 成为实 Jordan 
形 （3.4.6). 可以通过下述 H 个步骤来证明 这一# 实，这些步骤正是在 （3.1) 中的 Jordan 标准 
形定理的 ilF •明中所采 用的. 宵先，用 Schur 三角化定理的实形式（2.3.4>代转复形式 （2.3. 1>. 
在第二步和第三步，可以模仿在 fi 情形下的论述，说明在每个步骤都可以采用实相似， M 终将 
实形式 （2.3.4) 化简成变了形的渚三角子块或诸 Jordan 对角子块的一个直和， 其中. 主对角线 
上可能有形如（3.4.3)的2父2实子块（：(〜6>. 

g Jordan 标准形 （3. 1. 12 > 是诸上 •= •角矩阵的一个直和，而实 Jordan 形 （ 3. 4. 6 ) 是诸 
Hessenberg 矩阵或“近乎上二•角”矩阵的一个苜和，这是 W 为每个实2 X 2子块 r (« , W 在主对 
角线下有一个元素. 

我们也能提出其他的标准形，它们是一些友矩阵的 直和. 这种形式对复矩阵有一定的要 
求，但也有以下优点，它们适用于不同于 C 的域，而 Jordan 标准形对这样的域却无能为力. 

设是一个已知矩阵，且它的 Jordan 标准形是 （3. 】.】2).把相砬干每个不同的特征 
倌的所有 Jordan 块组合在 一起. 从每一组中选一个最大阶数的 Jordan 块，并把它从该组中取 
出.设认表示所有这些取出的子块的 直和. A 有多少不同的特征值 • 那么《,中将冇多少个直 
加 矩阵. 现在从每一组所余 T 的子块中选一 个最大 阶数的 Jordan 块， ft 把它从该组中取出. 
设 A 表承所有这些 f 块的 U 和.中直加矩阵的个数可能少于认， W 为某个子块可能已垦 
空集； 即 .4 的某个特征值可能只有一个相应于它的 Jord ⑽块. 继续作直和成， B,， …， 
B、， 直到所有 Jordan 块组都成为 空集. 的阶数是单岡+增的.于是^ ㊉ 氏 ㊉ … ㊉ 认置换 
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相似于 A 的原 Jor 山 m 形 （3. 1. 12). 

由于已作出的各个直和队是按 t 述方式构造出来的，所以每个氏的极小多项式与特征多 
项式是相同的.事实上， B , 的特征（极 小） 多项式恰好是 A 的极小多项式.因此，根据 
(3.3. 15), 每个仏相似于它的特征（极小）多项式的友矩阵. 

[153] 矩阵的特征（极小）多项式称为 A 的不变因式 /*(/>. 注意，它们的次数是单调不增的， 

且每个除尽 /*(/>, (一1, 2, •••• s -1. 第一个不变因式/,(/>=仙,（/)是 A 的极小多 
项式，且所有不变 W 式的乘积足 A 的特征多 项式. 诸不变 W 式按一 •种确定的方式由 A 的 
Jordan 块结构所确定，而 A 的 Jordan 块结构被 A 的各特征值夂及 （A — A ,/ )的¥的秩序列所确 
定. W 此，相似的矩阵将有相同的不变 W 式，乂 W 为不变 W 式也确定 A 的 Jordan 块结构，所 
以， 貝有 相同的不变 W 式的两个矩阵必定 相似. 因此一个矩阵的不变因式序列（它包括极小多 
项式 H 确定特征多项式）是 多项式相似不 变責完 全集： 两个矩阵 A ， 相似，当且仅当它 
们的各个不变因式钴恒等的. 

另一种描述 A 的不变 W 式的方式是定义/ ,(/) = (/ 一 A , P …一 A ,., 广"为 A 的极小多项式. 
冇宄 A 的 Jordan 标准形中太掉相应于/, ( />的每个因式 （/—) •，的一个 Jordan 块（这邱正是构 
成《丨的诸 Jordan 块〉, 且设/ 2 ⑴ =(/ 一 A , …•是余下的 Jordan 形的极小多项式.之 
后乂去掉相应于每 个因式 （/ 一人 V •的一个子块， fl 设/ 3 (/)是余下的 Jordan 形的极小多项式， 
等等.渚不变 W 式/ 〆 />正好是一系列被乐缩的矩阵的极小多项式 • 存每一步都要从被压缩的 
矩阵中* 掉某牲 Jordan 块. 

川不殳 因式来刻划相似矩阵 ft 理论上 足受欢 迎的，这 M 因为它淸楚地说明为什么极小多项 
式和特征多项式一般不足以判别相似性， / M •是它实际上没有把任何内容加到已经知道的准则 
1：网个矩阵相似，当且仅当它们的 Jordan 标准形是相同的. 

另方而，这样的描述可导出 A 的一个新的标准形 • 称之为有 理形. 这足因为只®对矩 
阵 A 的*元家施以有理运算便 可算出 它的各个不变因式. 

3.4.7 定理每个矩阵相似于它的各不变《式的友矩阵的 宵和. 

W 为已经有广 Jordan 标准形，复矩阵的有理形 （3. 4. 7) 似乎就没有什么用处了.引进/•它 
的理由是，它的另一种形式在仟意域上成立，不只限于复数域.域 F 上的任一矩阵在 F 上相似 
于它的 各不变 W 式的友矩阵的飪和，这些不变因式是系数取 A F 的唯一确定的多 项式. 我们对 
2 M 1 实数域来说明这一事实 . 

如果是已知实矩阵，那么 A ( SJ 能经一个复相似 变换） 相似于直和 B ,@ B 2 ㊉ … 
㊉ 13，，按这个次序，它相似于它的不变因式 （ 项认的特征多 项式， 々=1，…， A ) 的友矩阵的一 
个莨和 • A 的相应于非实特征值的诸 Jordan 块必须成共轭对出现.如果相应于一个非实特征 
值的一个子块出现在任一比中，那么它的共轭也一个出现在同一个队中， 々 =1 ，…， A •.于 
是，每个仏有一个实特征多项式 • 且由 （3.4. 7> 所确定的形式是一个实 矩阵. 实矩阵有理形的 
这个形式实际上可经一个实相似得到，我们略去了它的证明. 

3.4.8 定理每个实矩阵在 R 上相似于实首一多项式仏^)，/友矩阵 
的一个 直和， 其屮每个 />*•,(/> 除尽/»*(/)，々=1, 2 • 5-1. 多项式 />,(/> 是 A 在 K 上的极 



小多项式，乘积 />,(/)•••/>,(/) 是 a 的特征多项式， a 每个是 a 在 r 上的一个不变因式.多 
项式/> 〆 /)是唯一确定的，因而 R 上的两个实矩阵相似，当旦仅当它们有相同的不变 W 式. 

我们着重指出，相问形式的定理在有理数域 Q 或任一其他域上也成立.之所以得有理形 
这个名称，其原因不外乎是，将矩阵 A € M n ( F > 化成所述形式一般可以对/\在卩中的元索作有 
限多次有理计算来完成.因此，如果 F 是有理数域，只需采用具有有理元素的相似矩阵和有理 
系数多项式. 

一个涉及友矩阵的不同标准形也51以由 Jordan 标准形 （3. 1. 12) 推导出来.注意到每个单 
独的 Jordan 块有 性质： 它的极小多项式和特征多项式是相 同的. 于是每个 Jordan 块九, （ A , >相 
似于它的衿征多项式（/一1)••的友矩阵.闽此，整个 Jordan 标准形相似于这些多项式 d — W 
的友矩阵的一个 直和； 这些多项式称为 A 的初等 因子.值 得指出的是，用这种方式分解 A 时 
的直加矩阵的个数比分解 A 为有理形时 要多； 每个不变因式可能提供多个初等因子. A 的所 
有初等因子的乘积是 A 的特征多项式. 

如果则在 C 上计算它的 Jordan 形和初等因子时要注意到它们必须成共轭对 
出现. 如果将子块人 ,（ A > 和入 ( A ) 绀合 成一个直和，所得到的子块有实多项式 （/ — A )”. Q 55] 
作为它的特征多项式和极小多项式，因而它相似于[/ 2 — （2 ReA )/+ 丨 A 丨 2 ]”.的实友矩阵.后一 
个多项式是 A 的一个实初等 因子. 实线性 W 子的¥也可以作为 A 的每个实特征值的初等因子 
而出现. 

为丫避免混淆，通常将与初等 W 子 相关联 的标准形称为 有理标 准形. 

3.4.9 定理 每个矩阵 R 上相似于它的各（实）初等因子的友矩阵的宵和. 

相同形式的结论在任一域 F 上也 成立： 每个在 F 上也相似于它的各初等因子的 
友矩阵的 A 和，且这咚初等因子是系数取 fl F 的多 项式. 

^ 例如，考察矩阵 

A,=[a a 2 =u [了】 a ，=[: ::， 

且设 A = A ㊉ A ㊉ /\ 3 ® A 3 ® A , 6 M ,. 那么 A 在 R 上的冇理标准形是 

[4 ] ㊉ [4 ]， M 初等因子为 1—1， ( j -2) 2 , j 2 +9， j •一4， j --4. 在 C 上， A 的有理标 

准形 fiA •㊉ A 2 ©[3*] ㊉ [— l] ㊉ [-3,：] ㊉ [4] ㊉ [4], 且初等因子 为* r -1, (. r -1) 2 , 3 i , 

‘r 一 3 /’，j + 3 /，j + 3 /，j •一4， x - 4 . A 在 R 上的有理形是（' ㊉ ^ ㊉ 义 ㊉ [4] 的友矩阵） ㊉ （•七 
㊉ [4] 的友矩阵），且不变 W 式是 

/，（/) = (/ 一 1)(/一2) 2 (/ 2 +9)0 — 4) 和/ 2 (” = (/ 2 + 9)(/-4). 

在 C 上， A 的有理形是 （ A , ㊉ A ㊉ [3/] ㊉ [ — 3, J ① [4] 的友矩阵 >©([3,] ㊉ [一3!] ㊉ [4]>的友矩 
阵）. 应注意的是，不论把 A 肴成是中的，还是 MJC } 中的矩阵，这两个直加矩阵以及 
不变因式都相同，这对于有理标准形及其初等因子足不成 立的. 见本节末的习题2和 3. 

在本节的其他地方，基本上不采用实 jordan 形、有理形、有理标准形、不变 W 式或初等 
因子，在这里讨论它们，仅是 W 为它们在历史 t 的牽:要作用，同时还因为在不同于 C 的域上作 
矩阵分析时，它们是必不可少的. 



还有许多其他有用的标准形和矩阵分解： 

U ) 极分 解： 每个可以写 $A = PC /， 其中是与 A 有相同秩的半正定矩阵， 
而 L / eM N 是酉矩阵.见 （7.3.3). 每个非奇异矩阵也可以写成其中， G 6 
是（复）对称矩阵 （G = G T ), 且 Q € M n 是复正交矩阵 （ QQ T = J ). 

( b ) 奇异值 分解： 每个可以写成 A = V 2 W ,其中， V , 是西矩阵，而2 

是具有非负主对角元的对角矩阵，且2的秩与 A 的秩相同.见 （7.3.5). 

(c) 三角 分解： 每个 AeM ” 可以写成 A = c ； i ? a * ,其中， ueM n 是两矩阵， 而 KeM 是 
上三角矩阵. 每个实矩阵 A 6 AMR ) 可以写成 A = QRQ r ， 其中 QGMJR ) 是正交矩阵，而尺 

是具有一个特殊结构的上 Hessenberg 矩阵. 见 （2. 3. 5>. 

( d ) 每个 Hermite 矩阵可以写成 A = S〖（AW ,其中，从是非奇异矩阵，而 
/( A >6 A 1 是以+ 1，一1，或0为主对角元的对角矩阵.在 /( A > 中，元素 + 1( — 1>的个数与 A 
的正（负）特征值的个数是相同的： 0元的个数等于 w — ran k .4. 见 （4. 5. 8>. 

( e ) 每个正规矩阵可以写成 A=LMLT ,其中 M ， 是两矩阵，而是其主 
对角元为 A 的各特征值的对角矩阵.每个实正矩阵 A 6 MJR ) 可以写成 A = Q /) Q r , 其中0云 
A ^( R > 是正交矩阵，而 DGMJIO 是具有一个特殊结构的分块对角 矩阵. 见 （2. 5. 8). 

(f) 每个使得 A = A T 的矩阵可以写其中， S 6 A 1 是非奇异矩 
阵，而足主对角元为+ 1或0, 11其秩等 f A 的秩的对角矩阵，见 （4.5. 12). 

( g > 毎个使得/\ = /\ 7 的矩阵可以写成/ \= L /2", 其中，是西矩阵，而2：是具有 
非负主对角元的对角矩阵，2的秩等于 A 的秩.见 (4. 4.4). 

( h ) 每个西矩阵 K K 可以写成 U = Qf l£ 9 而每个（复 ）1 交矩阵可以写成 P = 
Qe ' • 其中 Q ， E ， F 6 M ,( R ), Q 是实正交矩阵 （ QQ r = /), E 是实对称矩阵且 F 
是实斜对称矩阵 （ F =_ f 〃）. 

( i ) 毎个矩阵可以写成 【厂 . S 、其中 S 是 1 H 奇异矩阵，卩是两矩阵’而2 
M 具有非负主对角元的对角轵阵.见 (4. 4. 10〉. 

习题 

1. 对于 

• 0 0 —r 

-1 0 0 和 

-1 0 0 . 

和 C 上 if 算它们的极小多项式，特征多项式 • 不变因式，初等因子，有理形和冇理标 

准形. 

2. 设 AeR ( R >. 假定 《/(/> 是 A 在 R 上的极小多项式，而 /(/> 是/\在（:上的极小多项式. 
为 11 么 /( O 的次数的次数？为什么 /(/) — 定除尽 （/(/>? 假定 /(t) = Pl (r)-hip 2 (t ) 9 
> t : 中 / Ai (/> 有实系数•试证 f(t)=^q(t). 为什么 /), ( A )=--/>. ( A )=0? 

3. 试用定理 （3. 4. 7>证明，如果 A , B 6 M ,( F ), 且 F 是 C 的一个子域 （ 例如 F = R 或 y ) , 
耶么 AB 在 F 上相似 • 当且仅当它们在 C 上相似. 提示： 试证 A 在 F 上的有理形与/\在（： 



t 的冇理形是相同的，且对于 B 也有类似的结果.这一结论是如何推广习题2的？ 

4. 设 A 6 MJR ), 且假定 A 2 = — f , 证明， n 必须是偶数，且有一个非奇异实矩阵5€ 
M ,,， 使得 

s ，= C — 

其中每个攀位矩阵 /6 M . /2 . 

进一步阅读本节所论述的有理标准形是十分经典的，其更详细的论述可以在 [ HKu ] 中 
找到. 在一段时 M 里，实 Jordan 标准形也为从事矩阵理论研究的人所熟知，但有关它的文献 
不多见.洌如，关于实 Jordan 形的论述可在 [ Kow ] 中找到.关于其元素是有理数或整数的矩 
阵的标准形的讨论可见 [ New ]. 关于特殊标准形的更为详细的讨论可见 [ Gan ]， vol . 2; 
[ Gant ] 和 [ HJ ]. 

3.5 三角分解 

如采线性方程组 Ax = A 有一个非奇异三角 （0.9. 3) 系数矩阵 A 6 M ,, 那么计算它的唯一解 
I 是相当容 易的. 洌如，如果 A 是上三角矩阵 

r«n 

A = 

0 

耶么 dct ••‘关 0. 然后利用后向 铃换： 〜心=乂确定 U 

fK •&含一个未知数的方稈 • 它确定 A -,; —般，方程组 

= b , , / = 一 l"i — 2,… ， 2,1 

中的每… 1 是穴一个未知&的方程（只要 …， * r •已被确定），它确定 

练4 2 是札奇异上三角矩阵，如果采用后向替换，试算出解 A*r = /; 所必需的纯 

W 乘法和狳法的次教 . 

练习培作奇异下三角矩阵，写出作为 A 的一个解法的前向替换. 

设是!卩奇异矩阵，但不是三角矩阵，应指出的是，如果 A 是用形如 

A = LU 

的分解肜式给出的，其中， L 是下二•角矩阵，卩是 上-角 矩阵，那么解出 >^. = 6 可以说是很 
简便的. 

练习 i 卩果 A = /.C 7 如上所述且非 奇异， 证明， L 和 [； 都必须是非奇异的， W 而必须有非 
零对角元. 

为 rm 可以先用前向替换解 



然 . di 后向替换解 


Lv = b . 



U.r = y , 

且所需计算 M 只是系数矩阵为简单的三角矩阵时的两倍.因此，如果得到分解所需汁算最 
不太大，那么这种分解对解线性方程组是有用的.在这里叙述它们也是适宜的， W 为它们的形 
式特殊，而把一个矩阵分解成这种形式可以不用特征值，而是利用线性方程组. 


3.5.1 引理假定可以写成 
T 59 l A = LU , 

其中是下5角矩阵，而是上三角矩阵.对任一分块形式 

「Au A l2 l . 「 L „ 0 1 r^ii ^ 


A = 


j “1: 

La 2 ： 


1 , r L " 

0 • 

¥r [ U u 

V ]2 - 

* /- = 

» 

U = 


LL21 

^22 - 

0 

U22 - 


其中 A ,,, Lu * U u ^ M t9 k ^ n , 我们有 

= A u , 

LiiUiz = -^iz • LjiL/u = A 2 i » 


/- 2 |[ 7|2 + LzzUi? = 

特別钻， /. 和 l ； 的左上角子块一定构成 A 的相应子块的一个同划的分解. 
练习用分块乘法运算验证 （3. 5.1). 


3.5.2 定理假定且 rankA = t 如果 

det /\( { 1，… •）}) # Ot j = 1，•••，々• 

那么/\可以分解成 

A = IAJ ， 

其中， 迸下7角矩阵， 176 M ， 是上三角 矩阵. 并 II 可以适当选择分解使徇 /. 或【/是非 
奇异的：都可以选取非奇异 矩阵， 当旦仅当即当且仅当 A 是非夺异的. 

证明： 首先 iff 明，在关于前主子式的假设条件下， A (丨 1，…， A }) 可以分解成 L ({1, …， 
k )) U ({\, k }) 9 旦它们都是非奇 异的. 能够逐个地求出 L 和 L ； 的各相关元素.设厂= 

「/,,]且卩 = [_〜]• 令 = l M 令1 = 1, — , k . 求出 


«,, = >• ) = 2广.上 

* it 

继续做卜 •去. 令 “ 22 = 1 ,且令/, 2 =…一 1 = 2 , k . 求出 


“ 2 广 么 


= 3,…，々• 


洱继续 下去，依次设【/的各对角元为1，然后求出 UU ， …， H ) 的下一列和 【/( U ， …， 

_ 的下 一行. 每次都有一个含一个未知数的方程需要 求解. 因为每个不为零[因为根据 

(3.5.1 )， det /-(</，•••， i})Xdet U ( U •…， /}) = det A ( U ，…， it )], 所以这个方程将是 
可解的.这就完成了 A ({1, …，々>)的分解. 

将 A 如 （3. 5. 1 >中那样 分块. 因为 rank A = k = rank A „ ,由此可知 [ A 2I A 22 ] 的各行是 
[ A n A l 2 ] 的诸行的唯一线性组合，即对每个唯一确定的 BeM , 有 


A 2 \ = BA n 和 A22 = BA I2 . 

现在将欲求的 L 和 U 同样如 （3. 5.1) 中那样分块，注意到非奇异的和 L / u 已被确定.于是可 
以用 （3. 5. 1) 求出 

^ i 2 = LiVA 〗 2 和 L 2 , = A 2 | L/n . 

然后求出 

^22 = Uy £ h 22 I 7 22 = Az \ L/|V /-II* Ai2 4 - L 22 L/ 2 2 = BA II All 1 Ai2 - f - /-22"22 
=A22 + 1 ^ 22^22 • 

为了完成分解，必需而且只需 

= 0. 

例如，可以选取 L 2? ( 相应地，（； 22 >为中的任一非奇异下（相应地，上）三角矩阵，希望选 
取以 22 (相应地，厂 22 >为0. W 为 /- M 和是非奇异的， L 或 L 7 可以选为非奇异的.如果 A = 

L = 栩[；=【7,,就是可非奇异的；如果々<”，因为 A 是奇异的， L 和 L ； 不可能都是非奇异 
的.这就完成了证明. □ 

3.5.3 例不是每个矩阵都冇一个分解.考虑 


如果 A 可以写成 


A = [ 0 H . 

Li oJ 

=lu= r** o ir u M, 2 l* 

J L 0 U22 J 


将要求 L 或 l ； 是奇异的，但是 LU - A 是非奇异的 • 

练习证明，一个非 Sf 异矩阵的左上角有一个々奇异主子阵，它就不可能冇 /. U 分解. 


1.5.4 例 


可以冇分解 iW 不满足 （3. 5. 2>的主子式 条件. 例如 


[: :] = [::][: 


有秩1, m 是它的 I , 1元是 o . 

练习（3.5. 4 > 中的 /.(_/ 的分解是不唯一的，即使要 求以的 各对角元都为 1. 试写出 


•0 0 


的其他儿种分解. 

■ 


现在已经很清楚了，一个已知矩阵的 LL / 分解是不唯一的，它可能存在，或可能不存在. 
不过，这许多麻烦，或者是由 A 的奇异性，或者是由 .4 的前主子阵的奇异性引 起的. 然 rfij 可 
以采用 （3.5. 1>和 （3. 5. 2) 的方法，对非奇异的情形给出一个完美的描述，并且可以利用规范化 
使分解是唯一的（标准 的〉. 


岡 


3.5.5 推论假定•是非奇 异的. 那么， A 可以写成 

A = LU, 

且使是下三角矩阵和为上三角 矩阵. 当且仅当 
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det 关0， j = I ，•••，《• 

此外， L 和 a 是非奇舁的 • 而分解实质上是唯一的.矩阵 .4 可以写成 

A - l ： DU \ 

其中. //(相庖地，是所有对角元等于1的下（相应'地，上角 矩阵. 而 D 是由 

det D ⑴，…，川 = det A (<1 •…•川 ， j = 1，•••，《 

所确定的非舒异对角矩阵. W 子【/'和 D 被 A 唯一确定. 

练习利用 （3.5. 1>, (3.5.2>和前一个练习，洋细证明 （3.5.5). 

再回到线性方程组 

_ Az = b 

的解法，假定不能分解成/-以，但能分解成尸 LU , 其中， 是置換矩阵 （0.9.5)， 
而 L 和【/如前，是下三角矩阵和上-角 矩阵. 这相当于在分解之前电排各个方程.在这种怡 
形 ， Ar = 6 的解法仍然是相当简单的，只要作替换 

Ly = P T b 和 {Jar = y 

就 进了. 应当知道，任一非夺异的都可以这样分而 Q 任一 可以分解成 

PLVQ ^ K 中也是一个罝换矩阵. 

3. 5.6 引理 设/是非钎异矩阵恥么，存在一个酋换拓阵尸使得 

det ( P , A )({ l . —,>>) 尹0, j = 1,...丄 
注意，正好是 A 的各解的…个 重排. 

证明： W : 明适々作 F 纳法.如见々=1或2, Ki ; 验证，结论敁然成之；假定结论-•直到 
々一丨 都足正确的. 芩虑捽舒舁珩阵 AtMp 并且去掉它的 K 后一 列. 余 f 的 々一 1列姑线性无 
关的， laiftifr 冇 々一 1个线性 无关為. 汜这苎解调换到前 it 一丨个 解的位 s , 然后对位于上方的 
-作奇》的 u —丨〉 XU -丨） 子妒砗应用归纸馊设.这躭确定了一个欲求的幣个贸换珩阵.因为 
r T A 枯非奇异的，所以毕. □ 

人 5.7 定理 设 A 6 A 1， 则#在置换矩阵 P , Q 6 M „. 下三角矩阵和上三角矩阵 
使得 

A = PLUQ . 

如果 A 是非夺异矩阵，可以取 Q =/， 且 A 可以写成 

A = PLU . 

证明： 如果 rank A 则/ \ 有一个非奇异子矩阵 （0.4.4 d >, 它可以通过互换 A 的各 

行和各列调换到左上角的 位罝. 现在把 （3. 5. 6) 应用于左上角，再应用 （3. 5. 2) 便得到第一型式 
的分解.如果 A 是非奇异的， （3.5.6) 表明，为应用（3.5.2>，右边的置换矩阵是不必要的， 
_ 这说明第二个分解是正确的，证毕. □ 

习题 

1. 本节所提出的理沦是就 /- U 分解而论的，其中 /- 是下三角矩阵， U 是 t 二角矩阵•试 
说明，可以平行地提出 U /. 分解的理论，但这两个因子一般与 LC ； 分解的因子不相同. 

2. 从（2.6 〕 节习题3可知，任 一 A € M ” 的 Q 尺分解可以有效地经 „ — 1 次 Householder •交 



換得到.这里， Q 是两矩阵.而尺是上7角矩阵.如果 A 分解成 QK 形，试描述可以怎样解 
出 Ax=b. 

3. 证明， AeM ., 可 以写成 

A = LPoL/. 

> t 中是非奇异下 = 角矩阵 • 是非奇异上三角矩阵，而 P ,, 是一个次置换矩阵[当 

rank A < ”时，置换矩阵中的一些元蒺1换成元素0 • 使其元素1的个数与 rank A 相同] .提 
示： 进行初等行变换和初等列变换. 

4. 如果的所有前主子式都作芩，试描述如何运用第三种初等行变换将/\的对角线 
下方的各个元索都化成零，从而使 .4 有 U ； 分解. 

5. (Lanczos H 对角化算法 •> 设 A 6 M H 和 / eCT 都是给 定的. 定义 ； C = [i Aj * A 2 ^ A " 1 
. r ]. 称 X 的诸列构成一个 krylov 序列. 假定 X 是非奇 异的. （ a ) 证明 ； T 1 尤 Y 是 A 的特征多 
项式的友矩阵 （3. 3. 12). ( b > 若是任意一个给定的非夺异上三角矩阵 RSeXK ， 证明 
S 呈上 Hessenberg 形式. （ c > 设: C ” 且定义 Y = [.vA • .v ( A ， > V " ( .V ) M 丨义|.假定 Y 
是非奇 异的且 y ' X 可以写成 LDL ；， 其中， L 是 下三角 矩阵， C ； 是上三角矩阵，且都是非奇异 
的，而 D 足对角矩阵 M 是非夺 异的.证明， 存在非奇异上三角矩阵尺和 T , 使得 

7 -p d 使 7- VAX / e 是相似于 A 的三对角 矩阵. （ ( U 若 AeyVt 是 Hemiite 矩阵 • 利用上述 
思路确定 一个算 法来得到一个相似于 A 的- 对角 Hermite 矩阵. 

6. 两个矩阵 A ， 称为等价，指的是存在非办异矩阵和 reAl , 使得 

B = SAT. 

( a ) iff : 明这个等价槪念是上的一个等价关系. （ b > 证明，每个矩阵等价于一个形 
如』，〜■的 矩阵， /6M *- ，/ 1. 提示： 利用初等行变换得到行简化梯形，_ 

然 G 对所得到的矩阵采 Ml 初等列 变换. （ c ) 证明，中的两个矩阵等价，当且仅当它们布相 
同的秩. （ W 假定等价于（丨 )》 中所述的特殊形式 • l ] T==A - 试用等价性阐述关 

于线性方程组 Ax ^ b 的解理论. 

进一步阅读上述习题5是从 [ Sie ] 改编过来的 • 在 [ Ste ] 中还可以找到关于 LL ； 分解的数 
值应用的其他资料. 


165 




第 4 章 Hermite 矩阵和对称矩阵 


4.0 导引 


4.0 .丨例如果/: D — R 是某个域 DCR " 上的二次连续可微函数，实矩阵 

称为/的 Hessian 矩阵.它是 j ■的函数， W 为可以用它来确定一个临界点是否为相对极大值点 
或极小值点，所以它在最优化理论中起着重要的作用 [(见 7.0>]. 

H 前，使我们特別感兴趣的性质來源于混合偏导数相等的®要事实；这就是对 
所有 * ，= 1，2，…， w 有 

i'H S 2 f 

心， ax ， 

用 Hessian 轵 阵 = J 来表示，这意味<*;••，对所有/，）= 1 ， 2 ， …， 《，有 / i , >=/!,,»即 H = 
H T . 设矩阵 A 6 M ,., 如果有鉍称它是对称麵阵.因此，一个二次连续可微的实值函 
数的 Hessian 矩阵总是实对私.矩¥ 


4.0.2 例作为第二个例 f . 设 A =「 化 j 二是某个具有实或复元家的矩阵，考虑由 A 产生 
的 R " 或 C " 上的二 次铟： 

舞 

Q <- r > = jt ' Aj = ^ a . fX . x , 

I •广1 
^ 、 1 

= 2 + a „) x , x i 

= j- r [-~(A +A T )]x. 

于是， A 和 + (/W AD 引出同一个二次®!，且后一个矩阵是对 称的. 因此，为了研究实的或复 

的二次幽，只要研究由对称矩阵产生的那些二次型就可以了.例如，在物理中，作为物体的惯 
性表达式，自然会遇到实二次型. 


m 


(4.0.4) 


4.0.3 例作为第三个例+，考虑用 

定义的二阶线性偏微分算子 L . 假定系数 〜（* r ) 和函数 /(* r ) 都是定义在同一个区域 DCR ” 上 
的， W / 在 /) 上应当是二次可 微的. 可以用一种自然的方式把算子 L 与一个矩阵联系起来， 
矩阵 A =[ 〜 （ i )1 不一定是对称的，但是，因为/的混合偏导数相等，因而有 


Lf = $^ ( x ) ^^ r .$ A [^ U) 


3 j :, 


(x) 
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= s +[“•々)+〜⑺]^^；. 

因此，对称矩阵 |( A + A T > 与矩阵 A 产生同一个算子 L ， 并且为了研究形如 （4.0.4) 的实的或 
复的线性偏微分算子，只要考虑对称系数矩阵就够了. 

4.0.5 例考虑无向阉厂：即厂由集合/ V 和集合 E 绀成，其中 N 是“结点”的集合{尸,， P ,， 
…， PJ , E 是无序结点偶（称为“ 边”〉 的集合 P „), < P l? , P , 2 }, …阁厂可以简 
洁地用它的所谓邻接矩阵.4 = (；%]来描述 • 这里 

_ |1,如果 e £， 

〜 10,否则. 

_ W 为 r 是无向图，所以/\是实对称矩阵：即 / TzA . 

4.0.6 例设 A = L 〜是实矩阵，考虑实双线性型 

歸 

= y/\*r = 6 R • (4.0.7) 

•’"•▼I 

当 A = / 时，它简化 为鞔通 内积.如果希望对所有 * r ，. v , 有 Q ( x , y )- Q ( y , x ) ,那么它必需 
而且只需对所有1_，_/=1，…， W ， 有〜=七,.为了证明这一点，只需注意到，如果 JT = ~ 和 
7 = 6,那么 Qk ， e ,)= A 且 QG ,， q )= 心.因此 • 实对称双线性型自然与实对称矩阵相对应. 
现在设是实的或复的矩阵，考虑复形式 

IV 

H(x,y) = y' Ar = yi a„y,Si » s*y ^ C\ (4.0.8) 

同 U . 0.7) —样 • 当八=1时，它简化为择 《 内 Vi . 这种形式不冉是双线性的，但是它对第一 
变元是线性的，而对第二变元是“共轭线性”的 （ H ( m , by )^ abH ( x , y )), 这正好与复 Euclid 
内积 相同. 有人称这种形式为半双线性的.如果希頊像内积一样有 H (* r ， y ) = H ( y , x ), 那 
么，与前述情形相同的论证说明，它必需而 R 只需有〜即/ \= A T = / V . 要注意的是， 
如果 A 是实矩阵，那么 

使 A = / T 的的矩阵类在许多方面是实对称矩阵类到 M ^ C ) 的自然推广.这样的矩 
阵称为 Hermite 矩阵； 要注意的是，实 Hermite 矩阵就是实对称矩阵.非实的复对称矩阵类没 
有实对称矩阵类那么多®要性质.在本章 • 我们将研究复 Hermite 矩阵和复对称矩阵，并且要 
特别指出在实对称情形成立的那些性质. 

4.1 Hermite 矩阵的定义、性质和特征 

4.1.1 定义矩阵 A = [ a ,,]6 紙称为 Hermite 矩阵，是指 A = A . ，其中 = 如 

果 A = — A ‘ ，则称之为斜 Hermite 矩阵. 

关于 A , 的一些 论断： 

1. 对所有 A + A - , •和 A '4 都是 Hermite 矩俾. 

2. 如果 A 是 Hermite 矩阵，那么，对 所有务 =1, 2，3，…， A * 是 Hermite 矩阵.如果 A 
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还是非奇异的，那么 ， A 1 也是 Hernihe 矩阵. _ 

3. 如果 A ， B 是 Hermite 矩阵， 那么， 对所有实纯最 a ， 6，是 Hermite 矩阵. 

4. 对所有 A -. V 是斜 Hermite 矩阵. 

5. 如果.4， B 是斜 Hermite 矩阵，那么，对所有实纯 tt “， A ，+ 是斜 Hermite 
矩阵. 

6. 如果 A 是 Hermite 矩阵，那么 / A 是斜 Hermite . 

7. 如果 A 是斜 Hennite 矩阵，那么 M ft Hermhe 矩阵. 

8. 任意可写成 


A 


= + > + 


-~( A - y \* ) = H ( A > + S ( A ), 


其中 H ( A )- y(A + A - >是 A 的 Hermite 部分 ，而 S ( A ) = y (. A - A * >是 A 的斜 Hermite 
郎分. 

9. 如果 A 是 Hermite 矩阵，那么 A 的主对角元都是实数，为了给出 A 的 n 2 个元素，我 
们可以自由地给定任意》个实数（对于主对角元）和任意个复数（对于非对角元）. 


4.1.2 定理每个可以唯一地写成 A = S 十,丁，其中 S 和了 都是 Hermite 矩阵.它也 
町以唯一地写成 A = Z 3 十 C , 其中 B 是 Hermite 矩阵，而 C 是斜 Hermite 矩阵. 

证明： 把/\ 写成 + + W > + ,[(-,/2 UA - A '>]• 并 R 汴意到 ) 和 

丁 =(-//2 >M — /V >都是 Hermite 矩阵. 关于唯一性沦断，我们知道，如果 A = E +/ F ， 其中 
E 和 F 都是 Hermite 矩阵，那么 

2.S = A +/T = (/ ： +/F> + (£： + if r r= K^iF -\-b： 9 一 iF • = 2E ， 

W 而 £= S . 类似地可以证明， F = T . 关于表示式 A = B + C 的论断也可用同样的方式来 证明. 

□ 

上述论断使我们联想到，如果把比作 复数. 那么 Hermite 矩阵就可以比作实数. C 中 
的复共轭运算类似于上的（伴随）运算 •• 一个实数是使 z = i 的复数—个 Hermite 矩阵 
是使 A = A •的矩阵正如每个复数 z 可以写成 2 = 5 + ,7—样（其中 a ，/6 R ), 每个复 
矩阵 A 也可以唯一地写成 A=.S + ir . 其中 S 和了是 Hermite 矩阵，还有另外一些性质进一步 
说明这种类似性. 

4. 1.3 定理设 AeM ， 是 Hermite 矩阵 • 那么 

( a ) 对所有 • reC ”， ，九/•是实数： 

( b ) A 的所有特征值都是实数： 

( c ) 对所有 S'AS 是 Hermite 矩阵. [yTo 

证明： 计算 Ar > •=.!■• /V x = x - Ax , 于是 A : 等于它的复共轭，因而它 

是 实数. 如果 Ai = Aj •且 1 >= 1 ，那么，根据 （ a ), A = A * r > =，Aor = : r ， Aj •是 实数. 最后， 
( S.ASK = AS ， 所以 S’AS 总是 Hermite 矩阵. 口 
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练习 当时， Hermite 矩阵的上述每个性质指的是什么？ 

(4. 1. 3>的每一个性质实际上（几 乎都〉 是 Hermite 矩阵的一个特征. 

4.1.4 定理 设 A = 是给定的，那么， A 是 Hermite 矩阵，当且仅当下述条件至少 

有一个 成立： 

( a ) 对所有是 实数； 

( b ) A 是正规矩阵，且 A 的所有特征值都是 实数； 

(c) 对所有 是 Hermite 矩阵. 

证明： 这只要证明每个条件的充分性就可 以了. 如果对所有 • reCT , ，九 r 是实数，那 
么，对所有 I , yeC \ + = A ^ + yAr > + (， A：y + y A . r ) 是实数.因为 

根据假设条件，， A. r + y .< v 是实数，得出，对所冇 * r , v 6 C ",+ 是实数.如 
果选取 = 6 和 .v = q ， 这就是说， 叫 是实数， Wrfrjlm % = — Im …*. 如果选取 .r = o 和 
y = 这就 ft 说， 一|<十 是实数，因 rfUKe% = Ke 这 W 个恒等式结合起来就等价于 
有叫=“， 又 W 为），々是任意的， W 此得出八=々' 

如果 A 是正规矩阵，它就是坷酉对角化的，所以 A = LfA ( T ， 其中 ， A = di a g ( A ,, A 2 , …， 
A „) 是由 A 的各特征值构成的对角矩阵.一畋地，冇 / V =(7 A 【 r ， 但是，如果 A 是 实钔阵 ，就 
有最后一个条件推出 A 是 Hermite 矩阵，这只需取口 
因为 Herrmte 矩阵显然是正规矩阵（儿 V = A : =. V .4), 第2敢中有关正规矩阵的所冇结 
果都适用于 Hermue 矩阵. 例如，相应十特征 fft 的持征向 M 是正交的.存在正交特征向 tt 
的一个完谷集： Hermitt •矩阵是可以西对角化的；等等. 

作为参考，我们特别叙述下 述承要 结果. 

4.1.5 定理 （ Hermite 矩阵的谱定理）设 A 6 M , 是给足的，耶么， A 是 HermUc 矩阵，当且 
仅当存在一个两矩阵 L / eR 和一个实对角矩阵 Ae / V ^， 使得 A = UAU \ 此外， A 是实 
Hermite 矩阵（即实对称的 >，当且仅当存在一个实正交矩阵 P 6 M „ 和一个实对角矩阵 A 6 R , 
_ 使得义^/^/ 37 *. 

虽然 Hermite 矩阵的实线件组合总是 Hermite 矩阵，但它 们的复 线性组合就不一定是 
Hermite 矩阵.例如，如果 A 是 Hermite 矩阵，那么 • 只有当 A = 0 时 M 才是 Hermite 矩阵. 
另外，如果 A 和 B 是 Hermite 矩阵 • 那么 C • -= iT 丫 = BA ， W 此， AB 是 Hermite 矩阵， 
当且仅当 A 与可交换. 

关于交换的 Hermite 矩阵的 M 著名的结果之一（因为在董子力学中它是到算子的 a 要推广） 
是定理 （2. 5. 5) 的下述特殊情形. 

4.1.6 定理 设夕是给定的 Hermhe 矩 阵族. 对所有存在酉矩阵 L /， 使得 LMt ； •是对 
角阵，当且仅当对所有 A , B 6 ^WAB = BA . 

Hermite 矩阵 A 有 A 等于 A •的性质，推广 Hermite 矩阵槪念的一种方式是考察 A 相似于 
./ V 的矩 阵类. 下述定理用几种方式刻划了这一类矩阵，其中第一个是说，这样的矩阵必定相 
似于（但不一定酉相 似于） 一个实的（但不一定是对角的）矩阵. 
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4.1.7 定理设是给定的，下述诸命题 等价： 

( a ) A 相似于矩阵 BGiVUR ); 

( b ) /\相似于； 

( c > A 经 Hermite 相似变换相似于 A 、 • 

( d ) A = HK 9 其中 H , 都是 Hermhe 矩阵，且至少有一个是非奇 异的； 

( e ) A = HK t 其中 H ， KeM , 是 Hermite 矩阵. • 

证明： 首先要指出的是 （ a > 和 （ b ) 等价： 如果 （ a ) 成立，则 S — 1 AS = fl =* r 1 B 7 T=：TT 
= 7'- , S ' A - ( S ~ l )' T , 这就是说， A - =(ST l S ' )~ l MST ~ l S ' ), 或者说 （ b > 成立. 如果 （ b ) 

成立， 那么/ \ 和 / T 冇相同的 Jordan 标准形.因为对任意矩阵 A 与 A T 相似，这说明，如 
果 J 是 A 的 Jordan 矩阵，那么 J 必须相似于 J . 因此，对*/中的每个 Jordan 块 A (A ) , A J 
中有一个相应的（相 N 阶数的) Jordan 块人 （ A >. 如果 A 是实数，就没什么可说的了，如果 A 不 
是实数 • 这就是说，相应千每个非实特征值的诸 Jordan 块和它的共轭必须成对出现.利用推 
导 （3. 4. 5) 的论证，得出 J 必须相似于形如 （3.4. 4>的实矩阵的一个直和，因而 （ a ) 成立. [172 

为了证明 （ b ) 组涵 （ c >, 假定 S — MSsA 、 且注愈到，如果对任意非零 d = r ， eC , T = 
uS , 那么 r M ： r = A . 因而 AT = T / r ， 或等价地 at * =厂 a _ . 相加这两个恒等式得恒等式 
A ( T + T -) = ( T - fT -) A -, 而如果 了 + T •是非奇异矩阵，这便说明 A 可经 Hermite 矩阵了+ 

7’•相似于 a 、 但是可选取“使 t + f 非奇这是 w 为， r + r •非奇异，当 a 仅当 7^(7’ 

+ 7 〜 ^l + n •非奇异，或当 R 仅当一 lFa (: r 1 ?^ >. 何是， T ' T - = e - 2 l 9 S ' l S ' , 乂因 
为可以选取 a 来得到任意(96[0, 2 tt ], 所以只需选取沒使一 ) 即可. W 而 （ b ) 蕴涵 

( c ). 


其次，假定 （ c ) 成之，并且写出尺 = 其中是非奇异 Hermite 矩阵.于是 


K l A = A- R l S.A = R(A'R '). 但 （ AW 1 ) •: K l A = A'R \ 因此 A 是两个 Hermite 矩 
阵尺和 /T/? 1 的乘积，且其中的尺是非奇 异的 . WiW(d> 成立 . 

机杲 GO 成立， iLA = HK , 其中 H 是非奇异矩阵，那么 = , 

从如果 K 是非钎异矩阵，证明是类似的. 

乱们 要证明 （ e > 蕴涵 （ a ). 如果其中 H 和 K 是 Hermite 矩阵， 
H . 都 fe 奇异考虑 CTA [；= ayf / L /)(【 rfa /), 其中，是两矩阵，它把 h 对角化成 
形式 

[D 01 , 

V HU \ = H \ 

Lo oJ 


使得是非奇异对角矩阵， k<n. 把矩阵 LT / CL 7 划分成与 H ' 同形的分块，使得 


WAU = H\V'KU)= 


"D 0*| 「 fC’ *- 

.0 oJL * * ■ 

n 

w 0 0」• 


子块是两个 Hermite 矩阵的乘积，其中有一个是非奇异的，于是根据 （ d ) 与 U > 的等 


价性，相似于实矩阵用表示 B 的 Jordan 标准形，使得 A 相似干形如 



的矩阵 C . 矩阵 C ' 是上三角矩阵，且它的各特征值是 J 的各特征值再附加个零特征值， 
对于相应于任一非容特征值的诸子块， C 的 Jordan 标准形的 Jordan 块结构必须与 J 的相同， 
J 73] 这是因为，如果 A ^ O , 每个幂 （ C — A / V 的（列）秩显然等于/!一 々 + rank ( J - A / r , r = l , 2, 
•••，《•特別是， C ： 的相应于任一非特征值的 Jordan 块必须成共轭对出现，因而 C 的 Jordan 标 
准形相似于形如 （3.4.6) 的矩阵，它是一个实矩阵. □ 

习题 

1. 证明 Hermhe 矩阵的每个主子矩阵是 Hemiite 矩阵.这一性质对斜 Hermhe 矩阵成立 
吗？对正规矩阵呢？ 

2. 如果是 Hermite 矩阵，且 S 6 M ,, 证明 SAS •是 Hermite 矩阵.如果 S 是非奇 
异的， SAiT 1 乂怎样呢？ 

3. 设 A ， ZieM , 是 Hermite 矩阵. 证明， A 与《相似，当且仅当它们西 相似. 提 示：如 

证明 A = CML 7 •和 B = Vy \ V ，其中1/和 V 是西矩阵， W 而 U . AL/=A = 

V BV . 

4. 验证 （4. 】. 1)T 面的性质1〜 9. 

5. 有时，通过证明一个矩阵与一个 Hermite 珩阵相似，可以证明它只有实特征值.关于 

这方面的一个经典例子如下 所述： 设 A = 是三对角 矩阵； 即〜=0,若|/一）| 

>1. 假定它的元素有很弱的对称件质 • 即对所冇,=1, 2 •…， ;/-1,有.证 
明，存在一个具有正对角元的实对角矩阵 f ) 使得 DAD 1 是对 称的. W 而得出 A 只有实特征 

值- q ]* 试说明为什么关于非对仿元的符号假定是必不可少的 • 试用极限理论证 

明，如果 i ^ O , 那么特征值是实的结论仍然 成立. 

6. 证明在下述意义下每个矩阵■由它产生的 Hermite 型， Aj ■唯一 确定： 如果 A == 
[ S ]， 是给定的，证明，对所有 j * eC ■有 j*-Ar = j ：， Rr , 当 且仅当 A = B . 提 
示： 如果对所有 j ^ C *， x'Ax = 0, 考虑 (•!■+>»)• A(*r + >0, 然后证明，对所有 I , : yeC ”， 有 
• r ./ Vv + y . Aj .= o . 选取 j .= 0 ， 厂-〆 〜，， ee R . 证明，对所有 <? eR 和所有），々一1，2，…， 
…有 a h) e 2,9 = —a jk . 

7. 证明，如果 n >2， 矩阵不能由它产生的二次型/九 r 唯一 确定；即： 如果 
2，则存在 A ， 旦 A 关 B ， 使得对所有•有 * r T / Vr = x r Rr . 提示： 如果 （:= 一 

s r Cjr 是什么？ 

8•证明，矩阵 A 6 R 不能由它产生的 Hermite 型的绝对值 || 所确定.提 示：设 
_ A = U ^•然后证明，对所有1云0，丨=丨， A 。, i . 

9. 证明，在下述意义下，矩阵 A 儿乎由它生成的 Hernihe 双线性型的绝对值所确 定：若 
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A ， 是给定的，证明，对所有 I ， yeC 1 有 | ， A：y | = | x'By \ ,当且仅当对某个 
有 A = 提示： 设々 = ]且 B = [6,>]• 利用 J ： = e ，和 : y = ~证明，对所有/，）= 1， 

…，”有 I I = I 6" | • 设 1 = y = se ,+ te k , 证明 i sa ^^ rta ^ | 2 = | sb ^-^ tb ^ | 2 ,因而对 

所有 a ，/GC 有 Re ( 分 [a, >“《*—/>,,、 ])=()• 若 尹0, 推出〜 二知 /6*. 

10 •证明， A6K 是 Hermite 矩阵，当且仅当 M 是斜 Hermite 矩阵.证明，一个斜 
Hermite 矩阵的各特征值都是纯虚的，而一个斜 Hermite 矩阵的平方的各特征值是非正实数. 

11. 如果 A, i3 6 At 是 Hermite 矩阵，证明 tr(Afi) 2 <tr A 2 庄. 提示： 证明 AB — BA 是 
斜 Hermite 矩阵，然后考虑 tr(AB — fiA> 7 . 

12. 如果 Ae ^ 是 Hermiie 矩阵，证明， A 的秩等于 A 的非零特征值的个数，但是对于 


非 Hermite 矩阵一般不成立. 




13. 若是 Hermite 矩阵& A 关0，证明 

rank ( A ) ^ A J 

. tr A z 

上述等式成立当旦仅当存在 一个具 冇标准正交列的矩阵1/ = [«广"《,]6^.,和某个 £ 2€1<使得 
A = aUV ； W A 是一个西射影的实纯 M 倍数.提示： 若 A ,， …， A , 是 A 的非零特征值， 
Cauchy - Schwarz 不等式是说： 


• [tr AJ = ( ) 2 < = r Xr A \ 

其中等式成立当且仅当所有 A , 相等. 

14.斜 Hermite 轵阵满足恒等式 A = — A _ • 如果％ R , 证明， A =^ e , 9 A ' • 当且仅 
当 〆 是 Hermite 矩阵.对于 <9=71，这是什么？对 (9=0 呢？说明为什么斜 Hermite 矩阵类 
可以看作“广义 Hermite ” 矩阵的无限多个类中的一个，并旦描述每一个这样的矩阵类的结构. 

15•设 Hermhe 矩阵 A = [〜]已写成如 F 的分块 形式： 



其中， 0-6 e -', A 6 M n -,. 证明 

del A = « i,,det A — j -' (adj A )x 

其中 adj A 是 A 的经典伴随[见 （0.8. 2>] •使 / V 满足更弱的什么条件就能保证这个公式成立？ 
提示： 按 A 的第1列进行行列式的 Lanlace 余子式展开 （0.3. 1>. 然后对所得到诸余子式的第 
一行进行展开. 


4.2 Hermite 矩阵的特征值的变分特征 

刈于一般的矩阵关于特征值的唯一特征是，它 们是特 征方程 p . JO 二0的根 • 

是. 对于 Hermite 矩阵，特征值可以表征为一系列最优化问题的解. 

因为 Hermite 矩阵 AfAl 的特征值都是实数，我们将约定，它们将按其大小递增（不减〉 
顺序 排列： 




Amin = Al < 义 2 < … ^ An = A m „. (4. 2. 1) 

很容易把最小的 和最大 的特征值描述成约束最小值和约束最大值问题.下述变分特征定理冠上 
了两个英国物理学家的名字，并且称， Ax/xxij Rayleigh-Ritz 比. 

4. 2.2 定理 （ Rayleigh - Ritz ) 设 A 6紙是 Hemiite 矩阵，且设 A 的诸特征值取 （4. 2. 1 >中的顺 
序，那么 

AyVg ， 对所有 j € C ” 成 


Am .. = A , = 


•Ar* 


= Ai 


• Ar. 


m 


证明： W 为 A 是 Hermite 矩阵，所以存在酉矩阵 L /6 使得 A^UAV , 其中 A = 
diag ( A , , A 2 , A „). 对任一 jeC •，有 

• r . Ar = x ^ UAU'jc = iV 4 x ) % AiV x ) 

歸 

= I > I ⑴ •！>. I ! 

由于每项丨 （LT * r ). 丨 2 是非 P* 的，于是有 

^in L' ! (U'x), I 2 Ar = '£\, I aJ'x), I 2 <A m . x 2 | (Vx), | 2 . 

• ■I i«i I 


W 为【7是西矩阵，所以 


t 1 ⑴、 a i 2 = E i 2 = 


因而我们已经证明， 

幻 〆 1 :二 A _ x'x < a * Ar < A ™., s'x = X„x * x . (4. 2. 3) 

因为，如東 i 是 A 的相应于特征值 A , 的特征向 tt , As = x - X x x = X x xx , 且对于义„也 

有类 W 的结果，因此，这40等式可取 等式. 其余的论断容易从 （4.2.3) 推出. 如果1关0, 
则有 


当 *r 是 A 的相应于夂的特征向讨时，等式成立，因而 

max — = A.. 


(4.2.4) 


最后，如果则有 


= ('舍 ） A (舍)和(舍）（舍)二 


因此，条件 （4.2. 4>等价于条件 


* Ar = A„. 


(4. 2. 5) 


关于 A , 的论证是类似的. 


□ 
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(4.2.5) 的几何解释是， 当 j •取遍 C" 中的单位球（它是紧集）时，函数， Ai 的 fi 大值是 
A„. ， A_r 的取值范围 （ 4. 2. 3) 则给出了下 述特征值包含结论 . 

4.2.6 推论设 AGM „ 是一个给定的 Hemiite 矩阵， o ^ C ” 是一个给定的非零向量，又设 
s ' Ax / xx . 那么，存:区间（一 oo , ^]中至少有 A 的一个特征值，同样在区间 [ cr , oo ) 中也至少 
有 A 的一个特征值. 

练习证明推论 （4. 2.6). 

练习关于 A , 的类似于 （4.2.5) 的结论及其几何解释是什么？ 

Rayleigh - Ritz 定理给出了 Hermite 矩阵 A 的最大特征值和 M 小特征值的一个变分特征， 
然而，其余的特征值又怎样呢？假定 A = L ^ UT , 且々，…， 〜]; U 的诸列是 A 的 
标准正交向 tt . 如果只考 虑与… 正交的那些向那么，对在 （4.2.2) 证明中的主要恒 
等式，应做如下 修正： 

Ar = 2^* I (l/'j), I 2 = 2^- I «.*J* 1' = I u ； x \ z . 

• — I 1 #^2 

这足 &， a 3 , …，的—个凸组合， larfri- 只要 x 与 u 的第 1 个列向 Mm 交，就有 

h m 1 « 

〆 Ar = ^X, I u,'j ： 1 2 > A 2 2 I u ' x ^ = *^2 2 I (W I 2 = X z x'x. 


如果取 .r = « 2 , 这个不等式就变成等式， 于是. 有第二个 ft 小特征值的一个特征 

min = minx- Ar = X 2 . 


(4.2.7) 


练习试推广上述论证，进而证明 

. j* Ar 


Ar = A* * k = 2,3,-» *w. 


(4. 2.8) 


练习证明 


max 


， Ar 


Ar = Xm-^k * 走 =1 ， 2,…， w — 1. (4.2.9) 


遗憾的是，这咚公式的实用价值 不大， 这是因为它们要求明确知道某些特征向 M ， 而通常 
乂没有这方曲的信息.但是， （4. 2. 7) 以及相关的公式 （4.2. 8> 和 （4. 2.9) 可以作为推导出一个 
有用的特征的出发点.设是给定的向最，耶么 

n 

supx ' Ar = sup j- * UAlJ 9 or = sup | U'x), | 2 

J ^ - I X X* 1 1 I 1 = 1 

T l U* X 丄 IT J 丄》， 

n m 

=sup ^X, I ^ I 2 = sup Va. I 2, I 2 


sup I z, I 




在上述第二行论证中， 令 且用到了以下 事实： 如果 _r ： r=l, 那么 L ； 是酉矩阵可推出 
z - z = l . 上述第一个不等式从以下事实得 来的： 如果缩小某集合，然后在其上取上确界，贝 IJ 
上确界的值不会增加.最后一个不等式是从次序关系以及常用的凸组性质得来的. 

在上述论证中，向是固定的，但乂是任意的，因而可以在所有 w 上取 （ 4.2. 10) 的下 
确界，这便得到 

inf supx * Ar ^ A ^- j . 

u^c" xV-l 

但是，如果则 （ 4.2. 10> 中等式成立，凶此有 

inf sup〆 Ar = A ^ i , 

ued' 

这个在形式上比 （4. 2. 7) 稍微复 杂一些的特征并不需要知道 A 的任何特征向因为 
时有 jH ”-" 所以 常常看 到这个公式用 “ max ” 代替 “ sup ”, 用 “ min ” 代替 “ inf ”. 这是下述 
Courant-Fischer “极小一极大定理”的基本思想 • 

4.2.11 定理 （ Courant - Fischer ) 设 是具有特征值 A ,— 的 Hermite 矩阵，走 

是给定的幣数，那么 




Ruylcig 

证明： 我们只考虑 （4. 
是 fi 矩阵 ， (W A = diag ( A ,, 


13) 的证法是类似的 


179 


n<a x ： 
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I I 2 彡 


这说明，对任意 《 — 々个向 M 


sup 




而 （4.2.9) 说明，为使等式成立，诸向鐘加.总有一种选择，即 u ；, = 〜_, 
因此， 

j - At 


，其中 U =[ W « ，二 


inf 


= A * • 


乂因为极值是可以到达的，故可以用 “ min ” 和 “ max ” 代替 “ inf ” 和 “ sup ”. 关于 （4. 2. 13>的证明是 
类似的. □ 

练习给出 （4. 2. 13) 的洋细证明. 

习题 

1. 设是具有特征值夂入的 Hermite 矩阵，试利用 （4. 2. 】】 ） 证明 

.J • Ar 


A * - 


A * — 






， 々=1,2, 
• At 


， k = 1 , 2 , 


CC- 


在这两个式子中， s , 表示）维子空间，其中在外侧取极小和取极大是对所有指定维数的子空间 
而言的. 

2. 如果 Mi 是 Hermite 矩阵，证明下述三个求极大值的问题有相同 的解： 


( 


( b ) 


• Aj - 


( c ) max - V . 如果 4 至少有一个特征值是正数. 

x.Ar-〆 J 

3. 如果是 Hermite 矩阵，且 * r ! r = l ， 证明 

Aiaai x A.V A Dun* 

4•通过考察 A = ^ ^来说明，在 （4. 2. 2) 中，关于 A 是 Hermite 矩阵的假定必不可少, 

mfixi ^ Ajr / x ' x ： 0关 R 2 丨等于 什么? max Re { x ' Ax / xx ： 0#* reC ] 等于什么？ 

5. 设 AeR 有特征值 { A 丄证明，即使 A 是 Hermite 矩阵，其特征值也有如下 界限： 

A ' 》_ = 1，2，".，”. 

提示： 取 x 为 a 的一个特征向 m , 并 a 用/\=^ \说明上、下两个界都是可以达到的. 



4.3 变分特征的某些应用 


在 Courant-Fischer 定理的许多 S 要位用中，银简单的应用是关于 A~h B 的诸特征值与 A 
的特征值的比较问题 • 我们用 A ,( A ) 表示矩阵 A 的诸特 征值. 


l 8 Jj 


4.3.1 定理 （ Weyl ) 设 A , 是 Hermite 矩阵，又设诸特征值 A ,( A )， A ,(13) 以及 A,(A + 

«) 均按递增顺序 （4. 2•丨）排列.则对每个2,…， w ，有 

KA ) 十< A*(A 十 《) < A *( A )+ A .( B ). (4.3.2) 

证明： 对于任意非 xec ”， 有不等式 

JT X 

因 lW 对任意々=1，2，…， w ，有 


A*(A + «)= 




or 9 (A-\-li)j ： 






^ min 

u i •…〜一 0 " 

类似的论证同样可以确定它的上界. 

练习说明在 （4.3.1) 中给出的界中可以取 等号.提示： 设{“，， tt 2 ，…，是由 A 的特 
征向 W 组成的 标准正交组 . R Au ,= XAA ) u ,. 分別对 a >0 和 a <0 考察 B = 


j. Ar 


A .( B ) = A *( A )+ A ,( B ). 


Weyl 定理对任意 Hermite 矩阵 A 和 13 绐出 f A+B 的特征值的 h 界和下界.如果限制《 
具有一种特殊的形式，例如《为正定矩阵、秩1 Si 阵、秩々矩阵或加边矩阵，还可以得到更为 
桔细的表述. 


矩阵 BeiVt 称为半正定的，是指它对所有有 * r . Rr >0. —个等价的条件是， B 是 
Hermite 矩阵，且所有特征值都是非负的（见第7章）.下述结果是 Weyl 定理的直接推论，称 
之为单调性定理，它 说明. 如果一个 Hermite 矩阵加上一个乍正定矩阵，则它的所有特征值都 
会增加. 


4.3.3 推论设 .1, M " 是 Hermite 矩阵.假定 B 是半正定矩阵， RA 和的诸特征 
值均按递增顺序 （4. 2.1) 排列.则对所有6 = 1，2,…，71， 

A,(A) <A*(A + B). 

证明：利用 （4.3.2) 中的下界及的事实. n 

如果矩阵 B 有秩1，那么用 A 的特征值作为 A + /3 的特征值的界具有 交错定 理的形 式：在 
A + B 的每对相邻的单号数（或双号数>特征值间至少存在 A 的一个特 征值. 

4.3.4 定理设 A 6 M " 是 Hermite 矩阵， z 6 C ” 是给定的向 ft . 如果 A 和 A 士 u ■的诸特征值 
_ 均按递增顺序 （4.2. 1) 排列，则有 
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(a) A*(A 士找 . )<A* +i (A)<A*4 2 (A±*z. 

(b) A*M><A*"(A±Z2：. )<A^ 2 (A), 


， k = l , 2 . …， w —2 
= 1 ， 2 ，…， n — 2. 


证明： 设— 2，利用 U .2. 12) 可导出下述 关系： 


A* t2 (A ± zz')= 


u » • 〜卜 〆 小 , 二 C «v— 2 


max 


• (A 士 zz ： ■ ) *r 


• (A±«：. >:r 


卜 ： ec : 丄 … . u 




J_ Ar 


^ min max 

u « •■■•**-* :气 * « €C * .-. C *：-' 

= A * + |( A ). 

现在设利用 （4. 2. 13> 可以导出下述 关系： 

、 / A _L. • \ 一 _ 一 1— ^ (A 士 ZZ 


• At 


A*(A 士 zz • )= max 


• )x 




^ max 

•**1 •"•.«*» I tc ' 


= max mi 

W，. ..1* V 〆 r ± yi ., f.Z 


• (A 土 饮 - 


: • Ar 


^ max 


= WA ). 


合并这两组不等式，由此得到所要求的不等式组. □ 

如果是一个 Hermite 矩阵，且 B = LMLT ，其中，是两矩阵， A = 
cliag (/3, , ft , …， /3"), 则 B 的秩等于非零特征值的个数.如果 B 的秩小于或等于^则可假 
定 如果秩小于 r , 则戽•决，…，尽含有某些为零的特征值，表示式 


B = YjP ' u ' u > (4. 3. 5) 

i=*l 

是衣示 Zi = CML / •的另一种 形式. 反过来，形如 （4.3.5) 的任何矩阵，只要所有尽关0且 U ,} 是 
无关组，那么它就有秩 r ; 如果不知道 U ,} 是否无关，那么13的秩至多是 r . Weyl 的下一个定 
理给出了当 B 有秩 r 时 A+B 的诸特征值的界，它来源于积分方程理论.本定理是 （4.3.4) 的 
秩1情形的简单推广. 


4. 3.6 定理设 A ， 是 Hermite 矩阵，并旦假定13至多有秩 r •.则 

(a) A*(AH-B)<A*4- r (AXA* +2 .(A-f i3), 6 = 1 ， 2，…， n ~2r ； 

(b> A*(/\)<A* +r (A + B><A* +2r (A >， 々 = 1, 2 ， ••• ， «-2r* 
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( c ) 如果 A = fML /_， 其中， L /= Oi 是西矩阵 ， A = diag ( A ,， …， A ")， 且 
又如果 

B = A„W„W,r + A„-| W.r-1 U:r\ H + A.-rt-l M.r-r+1 « 二 r 4 I ， 

则 X ttUk AA-B)=X m AA). 

证明： 设 B = a ，岣…，其中集合 U ,， …，匚 C ” 不一定无关， （ a ) 和 < b 〉 的 
证明恰好与 （4.3.4) 中 （ a > 和 （ b ) 的证明相同.只是在前面放上一个条件“ I 丄 〆 ’的地方，现在加 
上 r 个条件，…， w ”， 并完成相应的论证.关于 ( c ), 注意到 《,,•••, ^都是 A — B 的 
特征向 W ， 但是对于 A 二 w — r + 1 ， n — r 十2 •…，/?， (A — B ) w * =0,而对于> =1 • 2，… • 
”一”， ( A - B ) W ,= A * W *. 因为八所以 A — « 的 M 大特征值是夂， • □ 

练习给出 （4. 3.6) 中的 （ a ) 和 （ b > 的详细证明. 

上述结果所提供的足够倌息，使我们能够推导出 Weyl 关于两个 Hermite 矩阵之和的特征 
值的下述一般结果. 

4.3.7 定理 （ Weyl > 设 A ， 是 Hermite 矩阵 • fl A , B 和 A + B 的诸特征值按 （4. 2. 1 ) 
的递增顺序排列，那么 • 对于使得1<),且）的每对整数 ）， I 有 
函 H ) < A / A ) + A *( B ), 

而对于使得1<), 和） + A <; i +1 的每对整数 >• I 有 

A >( A ) + A *(«) < A ,4 .*.|(A + B ). 

证明：设），々是满 足第一组条件的已知 粮数 . SA = LM(A)LT, B = VA(B)V , 其中， 
卩 =[“|“ 2 …“ ， ]6 从和 7=0,% … 队 ] ■ 是两矩阵， A(A) = diag(A,(.A), — , A m (A)) 6M„ 
RA(«) = diag(A,(B), A„(B))6M li , 因而 

*^> — A ,( A + 又聲 I (八>1^|“： ，+ … - f - A,*I ( A ) m /4 | tt / 4 , 

的秩至多为 n — j , B k ^ X n ( B ) v m v ； 七… + A * u ( B ) ivhT ^ i 的秩至 多为” 一 K 而 A , + 氏 的秩至 
多为 2” 一）一々. 于是 • 根据 （4.3.6 c >， X „( A - A ,)= X ,( A ) 9 \ B — 私 > = 夂 （ B ) ，再根据 
(4. 3. 6 b )， A .( A - A > 4- B - B *)= A .( A + B -( A / + B *))^ A.-(,.- / -*,(A + B )= A ;+4 -.(A + B )(^ 
中 々 + r = ”且 r = —）一灸).另外根据 （4.3.2) 有 

XAA - A ^ B - B ,) < A , ) +/ L(B — B *), 

(其中 /r = W . 因此•有 

A,(A) 4-A*(B)= A.(A~ A ; ) +A.(B- B t ) AAA - A,-h B - B t ) 

=A”（（A + B) — （ A, +B*)> ^A f ^AA-hB ) 9 

这就是要证的第一组不等式.第二组不等式可直接由第一组不等式推出，只需把它应用于一 A 
和一 fi 即可. 口 

练习试给出从（4_3.7>中的第一组不等式推导出第二组不等式的详细 证明.提示： 利用 
(4.3.7> 得到 A m -”（一 A -扪 的一个上界，然后利用下面的 事实： 如果是 Hermite 矩 
阵，则又，（一4)=-夂-, + 1 (4). 

作为这种类型的最后一个结果，考虑关于 A + B 的特征值的交错定理，其中，假定 A 和 B 
中的每一个都具有特殊的 形式. 这个结果类似于（ 4 .3.4)中假定 B 有秩1的情形，称之为加边 
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矩阵的交错特征值定理. 


4.3.8 定理设 A 6 AI 是给定的 Hermite 矩阵，>七 CT 是给定的向最 • a 6 R 是给定的实数. 


设是在 A 旁镶 Ji.v 和 a 后得到的 Hermite 矩阵， 



j • : 


如下 所述: 


_ 


设 A 和乂的特征值分別用彳 A : > 和表示， R 假定它们按递增顺序和 
乂，排列，那么 

夂 < 夂 < 又 2 < A 2 < … < A H < X ^. (4.3.9) 

证明： 设走是给定的整数，我们要 证明夂 设 
^6C\ fee, 且 士， = [it ， i r u，] r e C" M • w,e C\ Tue C. 利用 Co ura m.Fi S cl» er 定理的 
(4.2. 12> 可导出 



= min max -— = X k . 

u « €C* j*o.j6C" S X 

关于 l 的下界，利用 （4.2. 13). 








— max min — = A *. 口 

一 eC* x^O.i^ C* J" 

我们已经莕到关于特征值的交错定理的两 1 个如果给某个 Hermite 矩阵加上一个秩 
lHermiP 矩阵或者通过加边造出一个新的 Hermite 矩阵，那么新旧矩阵的特征值必定交错. 
关于它们的逆命题又怎样呢？如果给定两组交错的实数，能否造一个 Hermite 矩阵，以及一个 
对它作了适当修改的矩阵使得它们分别以这两组交错实数为其特征值呢？回答是肯定的.作为 
例子. 我们给出定理 (4.3. 8>的逆定理. 


4.3.10 定理设 〃是给 定的正整数，且设 

U , : = 1，2,…， w } 和 ：，• = 1,2,…，十 1} [186 




是适合关系 


A , < A , < A 2 < A 2 < < A „ < A ,. < A . h , 

的两个给定的实数序列.设 y \ = di a g ( A ,， A 2 ，…， A „). 则存在实数和实向使得 
{ A ,, A ,, 是实对称矩阵 




的特征值集合. 


证明： 显然 U ,， A 2 ，…， / U 是 A 的特征值集合，又因为 trA = uA + “，我们必定有 a = 
tr A-tr A = SA ,- X ] A ,. 计算 A 的特征多项式 />；；(/) 是容易的，这是因为 

•=1 i* I 

， - [tl - A ： - yl 

det (" A ) = det ^. 士 . 

「 / : oirti-A i 一 : v 1「/ i oi-Ar ] yi 

L [(// — A )' '.>»] r : 1 J L — 3 » t j / — a JLo ； ' 1 - 

= d4"- A 4. r °. r l 

L 0 : U — a ) — y (tl — A ) 丨>»」 

=[(/ — a ) — y r (tl 一 A > _ l _ y ] det (" — A ) 


= [(卜 “)- 写 yf 

我们 Ll 经确定了值 c /, 因此，剩下要证明的是，个实数乂可以由 （4.2 
=1，2，…， 《+1 有 w ( A *) = o . 

定义多项式 

irM 

fu ) - /的次数 = « + i . 


(4. 3. 11) 


11) 来确定，使得对 


根据 Euclid 箅法，一定有 


K ^ t ) = II ~ A .), g 的次数= w . 


/(，）= — c ) -h r(/), 


(4. 3. 12) 


(4. 3. 13) 


其中，（•是实数，而 K /) 是次数至多为 ”一1 的多项式，通过亩接计算，求得 — 

— 1 I - 1 

=“• 另外，因为 g ( A »)=0, 所以对于々=1, 2，…， m ，/( A*) = ^( A*) (A* - a) + rU k ) = r ( X k ). 
因此，就知道了多项式〆 />在”个点的值 • 如果插值点 A ,， …，是互不相同的，则 r (/) 可以 
用 Ugrange 插值公式明确 写出. 在这个假定下， g ( r ) 只有申.根，因而，关于的 Lagrange 
插值公式是 


T 是， 


r (,) = 2/( A .)-, (A ? ( ( ； ) _—. 
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因为，对所有 / r = l ， 2, 

(A* - 


1+1， /( A , )=0, 就必定有 
yy — /( A .) ' 


= 0, k — 1,2, — 4 


(4. 3. 14) 


g (A,) X k — 

我们看到，如果对/ = 々一 ] 或々有 A *= A ,， 则相应的项 1/(/ 一 A , >有零系数，因而在 /= h 吋不 
会冇奇 异性. 如果对，=1,…，”，可以命乂 e — /( A ,>/^( A ,>, 那么 （4.3.11) 保证 p ； i ( A *) = 
0,于是就完成了 证明. 因此我们必须证明， / a >/^ a )< o . /=】，2，…， w . 而现在该用 
交错性假设了.利川 /(/> 和 W /) 的定义及交错假设，得知 


/( A .) = (一1>-出 JX I A ,~ A , 


^a.) = I A •—心 I ， 

雇 

因而 / a ) 和 〆 a >总有相反的符号. 

不难修改上述论证以适用于有些 A , 项相等的情形.例如，如果对某个々>2,有 A ,= A 2 = 
… = A *< a *，, — ，则 Af = A *= A _. (4. 3. 12>中的多项式片 （/> 冇因子 （/ 一 A , )(/ —》，）*•■; 
(4.3. m 中的多项式 冇因子 </一七>*, FU 恰好是 A , 作为 /(/> 的零点的®数.因此，可以 
用 （/ 一 除/(/)，来修改这每一个多 项式. 修改后的多项式片 ( n 将以幻作为其 

单® 芩点. 如果继续用这种办法取消 #(/) 的所有 蜇根， 则证明可以如前继续下去，且结论是 
相 N 的. □ 

上述各个结果讨论了在•个 Hermite 矩阵旁“镶”上新 的敁后 一行和铋后一列的情形，但是 
这也吋荇成坫给出了当把一个 Hermite 矩阵的 W 后•行和最后一列划去后其特征值的变化信 


息，3然 敁后一行或 一列并没什么特殊的.在 （1.3.8) 中，如果划去矩阵 A 的第，•行和第/列， 

足第 U + l > 行和<«+丨> 列，那么 ft 证明中，只是使 < Vm 变成 c 并 H . 得到相 N 的交错不等 
式组 （4. 3. 9). 


把定理 （4. 3. 8> 与 （4. 3. 10) 合在一起就说明，交错不等式组 （4. 3. 9) 是 Hermite 矩阵的诸特 
征值句它的仟一 〃一 1阶主子矩阵的诸特征值之间的相 互关系 的一个完整的描述.如果间时考 
虑 A 的所有 " 个（”一丨）（《 — 1>主子矩阵，那么还可以多说 儿句. 设次表示划去 A 的第）行和 
第_/列后得到的主子矩阵，）=1，2且设 A 和 A , 的诸特征值按递增顺序排列•对于 
每个/=丨，2,…， W —1, 有 


和 


max A.(A,) , (A) + 丄 A r ,, (A ) ， 

n rt 

min X,(A r ) < + ^A.(A), 

n n 

以 ax > ■(〜 


如果 A 的所有特征值非负 • 即如果/\是半正定矩阵，那么由这三个不等式中的第一个推出, 
至少有一个主子矩阵 A ,， 可使 
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71 

因此，半正定 Hermite 矩阵的每个土子矩阵的谱半径不会“很小”. 

人们可能希望从一个 Hermite 矩阵中划去若干行和若干相应的列，余下的矩阵是原矩阵的 
—个主子 矩阵. 下述结果可以 通过* 复应用交错不等式组（彳 .3.9) 来得到，但是从 Couram - 
Fischer 定理直接证明这个论断也一样容易.有时称这个结果 为包含原理 . 


4.3.15 定理设是 Hermite 矩阵. r 是整数 • 又设 A , 表示（从/\中划去 w — 

r 行和相应的”一 r 列后得到的） A 的任一 rXr 主子 矩阵. 叫对于使的每个整数々，有 
_ A*(.A) <A t (A r ) <UA>. 

证明： 假定 A , GM , 是从 A 中划去 /,••••, I ， ， 行和相应的诸列后得到的，且设 
利用 （4. 2. 12> 可导出 


A *, wr ( A ) = 









假定 



冉利) H (4.2. 13) 可异出 



^^ = 臟). 



C ； 





铐= 


定理 （4. 3. 15>的下述 简单推 论称为 PoincaK 分离定理 . 
场合，汴那里人们有关于 内积⑷ 方面的信息. 


A*(A,). 


□ 


它可以应用于（像贵子力学）那样的 


4.3.16 推论 设 AeM ” 是 Hermite 矩阵， r 是适合 ”的 某个 整数， 设… ，…， Mr eC 

是 r 个给定的单位正交向贵.设艮三[>••々《,如果 A 和队的诸特征值按递增顺序 
(4.2. 1) 排列，则有 

X t ( A ) ^ A *( B r ) ^ A *4„- r ( A ), k = 1,2, — , r . (4.3.17) 

证明 : 如果另选” 一 r 个向童•，…，使得…， M ,， …，是标 
_ 准正交组，设 L / sU , ，…， ujeM „. 矩阵 卩是酉 矩阵 ， ir ALT 与 A 有相同的特征值，而已 
U 应 I 知矩阵 a 是划去最后 „ — r 行和列后得到的的主子 矩阵. 现在，论断可从 （4.3. 】5)得 
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出. □ 

在上述结果中，矩阵 aeiVi 可以写成 LT AU ， 其中 L / eMy 是有 r 个单位正交列的矩阵， 
W 为 tr a = A l ( B r > + … + A ,( a )， 所以，下述极值特征可以通过相加不等式 （4. 3. 17) 来得到. 


4. 3.18 推论设是 Hermite 矩阵， r 是适合的某个整数，那么 

A[ (A) 4 ••• I A r (A) = min tr V AU * 1 

tru - ,€ ' 卜 6 M n . r . 

又 『〜1 (A > + … + AJ A) = max tr U' AU 9 \ 


(4. 3. 19) 


(4. 3. 20) 


如果 U 的诸列选为 A 的 r 个最小特征值的相应单位正交向*,则 （4.3. 19> 中等式成立. 
类似的选择推出 （4. 3. 20) 的等式成立.这两个不等式可以看作 Rayleigh - Ritz 定理 （4. 2. 2) 的推 
广，它们可以用来证明许多其他有意义的不等式. 

有吋，我们知道二次型•在一个子空间上的变化范围，把 Couram - Fischer 定理用于 
这种悄形便司以给出 A 的诸特征值的界. 

4.3.21 定理设是 Hermite 矩阵 • A 是适合的某个整数，设 A 的诸特 征值按 
递增顺序 （4. 2.1) 排列，且设 S * 是 C ” 的某个々维子 空间. 如果存在常数使得对所有 
• S * 有 j •九 r $(. 2> r >, 则 A ” 彡 A •-彡 c 2 . 如果存在常数 q ， 使得对所有有 
x * Aj ^ ctorx , 则 

证明： 设“，，…，是张成■的个单位正交向 W . 利用 （4.2. 13) 可导出 


r 2 ^ mil 


•Ar 


* Ar 




类似地，可以利用 （4. 2. 12) 导出 


= Air 


• Ar 


(4.3.22) 


19 T 


^ min max •~~； — = A *. □ 

-，•… .、 〆 " I 

4.3.23 推论如果 A 6 紙是 Hermite 矩阵， 且对々维子空间的所有向 量 > r 有 *r • Ar >0, 则 
A 至少有々个非负特 征值. 如果对々维子空间的所有非零向量有1* Ai >0, 则 A 至少有々个 
正特征值. 

证明： 第一个论断可由上述定理推出，只需取(. 2 =0.如果 A ,. *•,=()，则不等式 （4. 3. 22) 

说明 


0 = min 


•Ar 


- Ar . 


- 翁 

但 S * 是有限维的，所以集 D = U 6 S * : 1>=1}是紧集[见 （5.5.6)], 因而连续函数 ： r * Ar 对 
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某个满足的达到它在 D 上的极 小值； 特別是；尹 0. 然而， x ； Ax „=0, 这与 
当且 I 关0时有， A _ r 〉0 的假设相矛盾. □ 

Hemihe 矩阵的诸特征值和诸主对角元都是实数，且诸特征值之和与 诸对角 元之和（迹）相 
同.诸主对角元和 诸特征 值间的明确关系可用优化槪念给出 • 

4.3.24 定义设和卩 = M ]61 T 已知，如果对所有务=1，2,…，”， 

k k 

min j 2 戽, ：1 < 〈… min { ^] a ', : 1 < 6 < … < 6 < ，小 
> w 1 

且当々 = /!时等式成立，则称向优化向 i * a . 如果按递增顺序 

排列 a 和沒的各元素，则定义的不等式组可以表达成等价的形式， 

ix) ix ， (4.3. 25) 

192] 它对所有々 = 1， 2 •…，《成立， tl 等式对 A = w 成立 • 

因此，实向量卢优化实向 Mo , 是指对 A = l ， 2•…， n — 1，#的々个 ft 小元素之和大于或 
等于《的々个最小元素之和，且/?与《的各元素之和相等.应指出的是，可以任意改变/?与 0 
各元家的顺序，而不影响/?是否优化 a . 

优化槪念是在矩阵理论的许多场合中作为两个实数*间的确定关系产生出来的重要概念. 
这种情形的一个例子是下述 Schur 定理（1923>. 


4 . 3 . 26 定理设 AeM , 是 Herrniu •矩阵，则 A 的济对角元组成的向 fi 优化 A 的沾特征值绀 
成的向锨. 

证明： 证明 M 对维数作归 纳法. 对；1=1，没有什么可证的，所以，假定结论对所冇走< 
”一 1维 Hermite 矩阵 成立. 设 A = [% ] e 从是给定的 Hermite 矩阵， R 设 AjMu 是划去 
对应于 A 的最大对角元的行和列后得到的 .4 的主子矩阵.设夂 & A 的有序特征值， 
，是 A 的有序特征值，且设、是诸对角元按递增顺序的®排.根 
据归纳假定，对所有…， ，，一 1,有 

11 a y, > 

因为 交错性[定理 U . 3 . 8 〉], 还有 ； 

又 I < 又 I < 又2 A 2 < …< A « - J A „ * 

W 而，对所有々 ==1 ， 2 ，…，/?一 1 ，有 

>-i y-i 

因此 

k k 

^ k = 】 〆 ••，”一】， 

又因为迹是所有特征值的和，所以等式对成立. □ 

IMI 优化概念也可以用来表示矩阵之和的诸特征值与其被加矩阵的诸特征值间的 关系. 
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4.3.27 定理设 A ， 是 Hermite 矩阵，设 A > = [ A , ( A )]， MB ) = [ A ,( ⑴]和 ； U A + 

B ) = [ A,(A + B >] 表示 R ” 中的列向 《, 它们的诸分 M 各是按递增顺序 （4. 2.1) 排列的 A , B 和 
A+B 的诸特征值，则向 M A(A + fl > 优化向镦 A ( A >+ A ( fi ). 

证明： 对任意 A = l , 2,…， w , 利用 （4. 3. 18) 可导出 

k 

2] a.(A + B ) = min tr U * (A 4 - B)U 

i=l v m L *^ M t 

= min (xtV AU -bxrV DU) 

U * m 4 

^ min XrU m AU 4 - min tr U 9 BU 
u 9 u~ie M t u m u - i ( M t 

k t k 

= 十 = ^] a ( A > + A ,( m >. 

t«I 〜 I j«l 

因为 tr(A + S ) = tr A + tr «• 对于 ♦ = 等式成 i . □ 

我们已经说过，优化是 Hermite 矩吟的冶主对角元与它的诸特征值间的一个 确定的 关系， 
fti 足，在 （1.3. 26) 中只是达立起这种关系的一半-,为 T 证明另一半，斋要下面的技巧性引理. 

4.3.28 引理设&设“ 1 <，,:<^<〜和沒,<决<〜<尽是给定的实数.如果向《/?= 

[尽]优化向 = 则存在 n — i 个实鉍 y,， …， h ,, 使得 

a, < < a: < h :.(• 心 < …< n < y.-, < a ” ， 

且使得 〆 = [/?■• …，优化 y =「 y , •… ， y ., ,] r eR " 

证明： 如果 ” = 2, 则有 ai < 负=戽七 ft •或 

02 = (戽一 …> + 体 > 戌 > /?, • 

所以，因而可 以选取 y ,=/?, II 适合所述 条件.现在 假定且设4={[&，…， 

^ »] 7 } CR ^ 1 表示用不等式组 

a , 8 i ^ a : < 灸 …^ a * 1 ^ i ^ a M » (4.3. 29 ft > 

* k 

2^ ^ 2 a * k = 1.2. — . W -2 (4.3.29 b ) T 94 l 

I i*l 

定义的 点集. 因为 /? 优化 a ， 所以点 $= a = [ ai ， …， a -,] T 总在4 中， W 而集 d —定不空.△显 
然是 有界闭*，且容易矜出它是凸集.如果占 =[>,,•••, 则定义 /( ⑴於十… 

+ A - I . 注意， /( a ) =<n +… + a „ i <沒| +…如果能够证明有某个占€厶使/(占>> 

私+… + P "" 则根据△的凸件，对所有 / e [ 0 , 1 ]，将有 r fl +( l —并且 g (/)=/ (心+ 

( I — 将是适合 

尺 （0) + …+&, ^^(1) 

的连续函数.由此可以得出，对某个/。€[0, 1], 有 g ( f 0 )= 恥+…十沐- b 点 y =[ yi ] = / u a + 

(】一 将适合所述条件. 

因为 /( •) 是紧集 d 上的连续函数，所以存在点》6厶，使得 

max fid ) = f ( d ). (4. 3. 30) 

我们要证明/(》》供+…+疼极大值点厶适合不等式组 （4. 3. 29 a 和 b ), 因而 
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S k ^ a ^ i . 々=1，2,… •;? 一 1， （4.3.31 a ) 

k k 

< 2^* 走 = 1,2,…，《 — 2. (4.3.31 b ) 

i =1 i—l 

如果整个不等式组 （4. 3. 31 b ) 是严格的，且不等式组 （4. 3. 31 a ) 中至少有一个不是等式，则 
占至少 有一个分垃还可以增大以使/(》> 的值相应增大.因为这与极值性质 （4.3.30) 相矛盾，所 
以得出所有不等式 （4.3.31 a ) 必须都是等式， ^=[ a ,, a 3 . - , a ,] T , 因而/(幻 = a 2 +…+ a = 
<ai + a 2 + … + fl B ) — fli =(fii 十…+尽）一 a , = (/?, + … + 爲 > + 庆 一 a , 彡（戽 + … +/ i-i ) + 

私一…+^4, 这正是我们想要证明的. 

如果不等式组 （4.3.31 b ) 不都是严格的，则至少有 々的 一个值使等式 成立. 设 r 表示这种々 
值中最大的一个，于是 

#»1 t=! 

* k 

2 表 < 2 尽，々 = r + 1 ，…， w — 2 . 

• •1 ^ I 

_ 根据在上一段中相同的论证 • 对々 = r + l , …，”一 1,必定有 W 此， 
f ($) =(di +…+ A ) 十（ I ,十…十夂 •,） 

= ( 戽 + …+ 戽） + ( a r *-2 + + a n ) 

= (/?i + …+ 心 > + (a, + …+ a. > — （ a， + …+ a rn ) — …+ …+ 氏 i ) 

说 +…+尽，> + (/?, 十…+爲> 一+… + a ~ i ) — + … +馬1 ) 

=( 沒 I + …+戽 I ) + [(体 + … + fir^i ) — ( ai + — + arfi )] + ( fir^z + —十 /?") 

一 (firn + …+尽 | > 

>(你 + … * ^ I ) 4- ( fir ^ 一 /?,•,) + (尽 . 3 床，2> + …+ ( 爲 —/?.- i ) 

>坏十… +/?„•• □ 

我们现在可以证明（4_3.26>的逆命题广 • 


4.3.32 定理设；|>1， R 设…•和是给定的实数，如果向址《 = 
[ A ] 优化向 it A = U ], 则有实对称矩阵 A =[ 〜] eM ”（ R >， 使得，对,=1，2, … ，”成 
立，且使得 ( A ,} 是 A 的特征值集合. 

证明： 对《=1，论断显然成立，假设对至多有 W —1 个元索的所有这些向擞《和 A , 论断 
已经 证明. 根据引理，存在实数 y ,< y 2 <〜< y M ,,使得 

又 | < y- < 又： < … < 又，- 1 < < 又”， 

且使/ = [“，，•••， i ] r 优化 y = [ y ,]’ eR * 1 、根据归纳假定，存在实对称矩阵 b=|>,,] e 
Mn - i ， 使得彳乃丨是 B 的特征值集合，枉对/ = 1，2 ，…， w — 1有= a ,. 如果厂= diag ( y , , 

72’ …， y ” ^ eM .-. CR ), 则存在实正交矩阵 Qe AC , (R) 使得 B = QrQ T . 根据定理 
(4. 3. 10)， 存在实对称矩阵 


A 





Je m„(R), 


•v e r 1 , a e r. 
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它有特征值 U , L 如果令 



•Q 

-0 


:] C 



~QTQ 7 Qy 
AQy) T a 



B 

(Qv) 


Qy 


则 A 有特征值 u ,}， 且冇主对角元…， A, …， A ,， a . 但是，根据优化条件 ， trA = q + 


+ A . 1 +a = Ai +…十七二⑷+…十，因而 R A 有符合要求的对 角元. □ 

上述结果不仅完成了涉及 Hermite 矩阵的诸主对角元和诸特征值间的关系的推理过程，而 
且能够解释优化关系 fl 身的儿何意义.双随机矩阵有，个非负元，且每行和每列的诸 
元之和是 + 1 . Brikhoff 定理 （ 8 . 7 . 1 ) 保证每个双随机矩阵是有限多个置换矩阵的一个凸组合， 
反之亦然. 




4.3.33 定理设 a = k ] eR " 和; 3 = [^,]6 ir 是两个给定的实向 it , 则下列条件 等价： 

( a ) 优化 a i 

( b ) 存在双随机矩阵 S € M „ 使得 

N S 

( o/?e 丨，其中 i < n < oo ,/>.>(>,= i , 而 ' e r " 是一个向坩，它的诸分 

•> 1 

世是已知向的 诸分摄 的某个置换. 

证明： 如果假定 （ a ) 成立，则根据 （ 4 . 3 . 32 ), 存 ft 有主对角元乂=/?,和特征值 
的实对称 矩阵. 根据谱定理，冇酉（甚至实 正交） 矩阵 = 使得,其中/\ = 

diag ( a , ,…， aj , 而考察 B 的诸主对角元可知沒=&，其中 5 = 是由 S v = U v | 2 

给定的.因为 U 的每行和每列是单位向 tt , 这个 S 的每个行和及每个列和都等于 1 ，所以 S 是 
«随机矩阵（称这个特殊形式的矩阵为正交随机矩阵 K 这就证明了 （ a ) 组涵 （ b >. 

(1>) 涵 （ a > 的证明在本节末的习题9中 W 述. 

如果假定（〖>)成立，则 BirkhoH 定理 （8. 7. 1) 说明， 

•V \ 

S = 其屮 P , >0， = 1， 

而每个 P , 是置换矩阵.因此， 

•V V 

p = Sa = ^ p . P.a = Aq .. 其中 P,q = a K . 

这个恒等式也证明了逆蕴涵关系/ * □ | TF 7 

这样一来，由某个向请/?=[/?,，…，优化的所有向姑 a = [ fl ,， …， 〜] T 组成的集合， 

可以先汁箅出《!个向楗然后作这些向 M 的凸包来得到 • 而这《!个向 M 是采川置换/?向址的，， 

个分 M 的办法得来的（当然，如果诸项/?,不全不则这些向 M 也不全不 N >. 

附注虽然一致赞同优化这一基本概念是很重要的，但采用的记号常不一致.有些作 
者用 （4. 3. 25) 中的反向不等式定义优化 • 而有些作者定义优化是按递减顺序排列两个 
集合.因此，当人们从不同的文献中采用或引用有关优化的结果时 • 一定要倍加小 
心.参看习题1丨中促使我们选择优化定义的理由. 
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习题 

1. 我们知道，矩阵的谱半径是数值 

p ( A ) = max { I A ,( A ) | ). 

设 A ， 是 Hermite 矩阵. 试用 Weyl 定理 （4. 3. 1) 证明 

A ,( B ) < A*(A + B )- A *( A ) 

因而，对所有 6 = 〗， 2 ， ••• * w 有 

I A *( i 4 + B )- A *( A ) 

这是关于 Hermite 矩阵的特征值的扰动定理[参 ft (6.3)] 的一个简单例子. 

2. 试说明仅利用定理 （4.3. 证明中所导出的第一组不等式如何得到定理中所确定的所有 
不 等式.提示. • A =( 力土 a - )不以、 

3. 洋细证明 （4.3.6 b > 等价于 （4.3. 6 a >. 

4. Weyl 定理（4.3.7)的证明中只用到丫不等式义“.4十乜）彡义„-,(/\>，其中 B 至多有秩 r . 

证明这个不等式无须利用 Courant Fischer 定理，而是用需要提供洋细论述的下述 论断. 假定 
«= 汴 … + A 夕， 并目设 A = LMIT ,其中卩 =[“,•••“,] 是两 矩阵. 则存在 r + l 个纯 
tt O h r 9 O '” - r 十"…， OW ，使得对所有 / = 】， 2 ，…， f ， 向 M J •三 (2" • r … + a B W , 适合 ~T 丄 

y > • 且 | Qn r | 2 +…+ I a , \ 2 — l . 于 M 

n 

彡 ， （A - = 2 U , \ ? X ,( A )^ X n r ( A ). 

5. 试应用定理 (4. 3. 8 )w — r 次来证明定理 （4. 3. 15). 

6. 试说明，如果八和《不是 Hermite 矩阵，则 Weyl 的简单不等式组不一定成立. 提示： 
齡 [: M :]• 

7. 如果 /\，是 Hermite 矩阵，它们的特征值按递增顺序排列 • 乂如果 
证明 A *( A 4- B )< min { A l ( A )+ A i ( B ), *•+_/ — + ”}• 

&试对定理（ 4 .3.10> 的证明中冇相同项 A , 的情形给出洋细 说明.提示： 如果 A , 是 /;(/) = 
0的々租根 • 々彡2，证明，在得到的 （4. 3. 14) 中， （4. 3. 14> 的分母中的，⑴的因式 （/- A , 广 1 
可消去 (4. 3. 14) 的分子中 /( r ) 的因式 （/— A ,)* 1 . 

9 - 设5=0•，:是双随机矩阵（8.7>， 16 只”是实向量.证明&优化 A 提示： 设 7 = 
S - 只要对: V ”与的情形证明就可 以了， 因为如果不是这样，就可以对适 

当的置换矩阵 P 和 Q 来考虑和 ( ir ; 而尸 T SQ T 仍是双随机 矩阵. 设 = f 〜，于是， 

1*1 

0 < w , k, < 1,且 J >;*， = t 证明 

>^1 

S ~ _ 2*^ + j ** (々—士议，广） 

>*■ 1 »=1 >»I 

= 2 ( 1 - 切广 ) (J* 一 r , ) + 士 (_r ; — x*). 
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10. 用下述思路给出定理 （4. 3. 26) 的另一个 证明： 若 A = U ,； KK 是 Hermite 矩阵，则 
A = UAU ' ,其中 = 是两矩阵 ， A = diag ( A ,, A ,) 是实对角矩阵.设《 =[叫， 

心2，…， Hr m y 是由 A 的主对角元组成的向量，且，…， A „] 7 . 证明 a = Rr ， 其中 
P = [/ >J = C I I 2 ].证明 P 是双随机矩阵，然后利用习题 9. 

H . 设1=0,•…， a ] 7 和：^^：^，…，是两个给定的非负实向撤，旦假定 y 优化 a 
证明: V , 提示： 利用（七3.32)构造一个实对称矩阵>\ = |>,,]6从（!0,其中主对角 
元 ，而特征值 A ,( A ) = j \ •则 Hadamard 不等式 （7. 8. 1) 是指 ⑹… ‘>det ••义 . 

附注这就是促使我们选择优化定义 （4. 3. 24) 的理由.如果有人选择与 （4. 3. 24> 中的 
不等式相反的方向，則所得结论与习題丨1中的不等式相反，即，如果在这个意义下 
/•优化 " r , 則： y , 的東积小于 j •，的 乘积. 我们喜欢的定义形式是，乘积不等式的走向 
与优化的方向相同. 

12. 设是具有 1 E 特征值的 Hermite 矩阵，乂设是一个 
给定的幣数.用习题 丨1 证明 

AiAj -'- A , ^ minCw ,' Aw , )( u ? r Au - )•••(«/ Au r ) , 

其中极小取遍所冇标准正交绀 U ,, “ 2 ，…， u .) C ： C \ 说明为什么这个结果可以相继矜作 
<4.3. 19>的乘法模拟， Hadamard 不等式 （7. 8. 1 ) 的推广,联系 Rayleigh Ritz 定理 U .2. 2> 与 
Hndamard 不等式的不等式 系列. 提示： tS 形 /*= w 是 （ 7. 8. 1 >• 情形 r=l 是什么？ 2<r< 
”，用 （4.3. 19) 证明， 向 W[«rA«,, •••• 优化向 M 0" …， / i ,]' 其中， 

对所有/= 1，2，…， r — 1,外=义•，而 

〜 = (w〖. Am, + … t Ur ~ iAu r 丨 > — (A_ + … Ar 1 ) - f - u ' Au r ^ u ' Au r . 

然后用习题 11 证明 A , … A , ，“ / A 心 < TK 、. 

I 

13. 设 .4 = [〜] 6 iVf ,. 是 H 冇非负 特征值夂的 Hermite 矩阵.证明，对毎 
个 r =〗， 2 •… ，…乘积 A , …夂小于或等于 A 的 r 个最 小主对角元之乘积. 

如* A ， 是 Hermite 矩阵 ， A — B H 有唯一非负特征值，证明对所冇,=1, 
2,…，沒有 A .( A )> A .( B >. 

15. 式 W (4.3. i 6) 证明 （4.3.26>. 提示： 用 H 换矩阵调整 A = [〜] 使叫 
然后 Hi #- r jf M,. r • 并 ii 证明 A , ( A ) + … + A ,( A)<tr AU ^ a ^ + … 

16 •假定 A € M " 是 Hermite 矩阵，设 A ,< 夂是 A 的特征值，而 A ,., <… < A ,. 】是 
U _1) XU —1) 王 f 矩阵 A ( W }) 的特征值，证明 

又 I 义“1 又2 又“2 < | < An . 

这 些交错不、$ 式常归功于 Cauchy . 同时证明这些不等式蕴涵 U . 3. 15>中的诸不等式. 提示： 
利用 （4. 3. 或 （4. 3. 15). 

17. 如果/\ = 是 Hermite 矩阵，且对某个/， a „ = A „ * 证明，对所有々 = 】，2， 

…，… k 关 i ， 有…如果 ci w = A ,， 则也有类似的结论. 提示： 对《>2采用直接计 
«:• 然后应用交错性便可证明结论. 



18. 设 Ae 紙是 Hermite 矩阵且设 a,=det A ( U ， 2,…， i >), ^ = 1，2,…， w . 若 A 是 
非奇异的，证明 A 的非负特征值的个数等于序列+ 1, “，，〜，…， 〜中 正负号的变化次数. 
特别地，若这些主子式都是 正的， 则 A 就不会有负特征值.如果某个 a , =0,会出现什么情 
形？ 提示： 利用交错性. 

19. 设4 = [_^]6从 >1 是正规 矩阵. 证明，若 A 有“小”列或行，则 A —定有“小”特征值. 
说得更明确些，设 A 的诸特征值的绝对值的平方彳 U 丨 2 : /=1， …， 幻按非减顺序排列，并 
且用表示所得到的有序值.设各行(或各列）元素的绝对值的平方和的平方根 

n 

i 2 ) l/2 :，= i , …， w 按非减顺序排列， 并且用 表示所得到的有序值.证明 

* = i 

k k 

其中々=1,…，”， 

•-I 1-1 

—个类似的上界可用列平方和表示.提示：数 M W 是 Hermite 矩阵 AA •的特征值. AA •的诸 
主对角元是什么？用优化和定理 （4.3. 26). 关于列和不等式可考虑 

进一步阅读关于优化的另外信息可参看在定理 U . 3. 10) 下面提到了诸主子矩阵 
的特征值间的一般交错不等式组，有关的讨论可参看 C . R . Johnson and H . A . Robinson , 
“Eigenvalue Inequalities for Principal Submat rices Alg . Appl . 37(1981) , 11-22. 习题 4 

中槪述的论断的原始证明可参肴 H . Weyl * M Das asymptotische Verieilungsgesetz der 
Eigenwerte linearer partiellcr Differentialgleichungen (mit einer Anwcndung auf die Theorie der 
HohIraumstrahlung , w MaM . Annalen 71 (1912). 44 Iff . > 在文献的444-彳45(页）可看到其引理 
的 证明. Weyl 用积分方程叙述并证明了他的结果，但把它转化成线性代数的形 式是直 接的. 

4.4 复对称矩阵 

矩阵 A 6 A 1 是对称的，是指 A = 在许多场合，所研究的对称矩阵只有实元素，因而 
它们是实 Hermite 矩阵，并且本章迄今所讨论的全部结果都适用于这些矩阵. 

但是，在有些情形，我们要与复对称矩阵打 交道. 一个例子是研究复平面中单位圆盘的正 
则解析映射，如果 /( z ) 是单位圆盘上的正则解析阐数，又如果 /( d 是适合/(0)=0和/'(0) 
= i 的标准化 r 的函数 • 那么，/(2)是——的（有时称为单叶 的〉， 当且仅当 

对满足丨 Z , ICIWAa ，".， 16C 的所有选择，点 I ,，…， A6C 的所有选杼和所有 M = 
1 ，2，… 成立. 如果则右边的差商珂以看作 /'( A ). 这些称为 Grunsky 不等式组的庞 
杂不等式有很简单的代数形式 

• r . Ar s } Bx \ , (4. 4. 2) 

其屮 = A-[a„]eM,, 8 = [6jeM w . 

〜二 • log 广 1 b„ - lo g r ? r Z ff ( 1 

\—Z,Z y z, — Zj 」 

应注意的是 • A 珐 Hermite 矩阵，而 《 是复对称矩阵. 
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另一个自然要产牛复对称矩阵的例子出现在一般的矩问题中.设彳〃 2 , … （是给定 
的复数序列，设是某个正整数， a 定义 = 注意 a 2 „ 是形状为 

Hankel 矩阵的复对称矩阵.对我们考虑复二次型 i T A 2fI x ,要问是否存在某个固定常 
数£>0,使得对所有和所有《 = 1，2,…有 

I Jr T A 2 m J ： < j *' j *. 

根据 Nebari 定理，这个条件成立，当旦仅当存在一个几乎处处有界的 Leksgiie 可测函数 
F (/) : Fit )： R - C , 它的 Fourier 系数是已知数％, “，， u 2 , …；关于 F (/) 的本质边界恰好 
是上述不等式组的常数 c 

在实际应用中复对称矩阵似乎不像 S Hermite (或实对称）矩阵那样几乎经常出现，但是前 
两个例子说明 • 它们还是出现厂虽然复对称矩阵不一定可对角化（见本节末习题15)，可是 
«利 称轵阵 冇一个类似于 Hermite 轵阵的进定理 （4. 1.5) 的分解，并且可以用逻辑上类似的方 
法来证 明它. 我们萏先证明一个与 Schur t •:角分解定理 （2. 3.1) 类似的定理，它说明，包括对_ 
称矩阵在内的一类矩阵总可以分解成= ,其中 L / 是两矩阵，4是上三角矩阵，如果上 

5角矩阵是对称的，则它必定是对角矩阵. 

4.4.3 定理设 A 6 M , 珐给定的，那么存在两矩阵 (76 M , 和上三 角矩阵使得 A = 

_ T ， 当且仅当心 i 的所有特征值足非负实数，仵这个条件下， d 的所有主对角元可以选取 
非负值. 

证明：凶为 £7足两矩阵 HC / 7 = (7* , 所以， 如果 A = (^ L / r , 则 AA = U ^ f / r t ^ CT . 当厶 
是上三角矩阵时， 上三角 矩阵 M 的诸主对角元是非负实数 • 且西相似于 W 此，从上 
气角矩阵的诸特征值恰好是它的诸主对角元这一琪实便珂推出条件的必要性成立. 

关于圮 分性， 假定 AAR 有非负特征值， FI 设 * r 是 AA 的一个特征向撖 ； 即 = 

旦 A >0, 有 W 种可能 悄形： 

( a ) 九 2 •与相关* 

Ai 与 a * 无关 • 

在前一种情形 （ a ) (当 A 是 AA 的单特征值时，这种情形总是成立的），存在某个使得 
Ai = w . 但是 | 户 | = 因而 在后一种情形 （ b > 

(如果 A 是的1特征值，这种情形珂能成立），对所有 / i 6 C ， 向漦7 =九^ + /^是非零的， 

并旦可 以选抒//为适合丨戶 I - =////= A 的任一 复数. 于是 A .[ = = AA.r \ /tAx = Xs 

-f ^ A.r = w j - 4 = ^ (. Au - 4- ^ j - ) = ^. v . 在情形 U ) 或 （ b >, 我们已 证明. 存在某个非芩向 械 

和某个有 I V I =A 0< JaeC , 使得 At ，= av ， W 为这个悄等式在 i ; 乘以正纯 M 后不变 v 所 
以还可以假定 V 是单位向敎.同时，对任意 & R . 有 = 〜 i ; = ( ef - 2 l D (6)， 且当 

v 是单位向时，也是单位向«，因为可以选取0 使得 〆 因 iftj 得出，如果 A6R ， 

HA 是的非负特征值 • 则存仵单位向 Mi ;, 使得 Ai =( n ,， 且(；=+々>0. 

现在把这个向 M 扩充为 CT 的标准正交基 h ,, ，^，…， tU . 且设 V ,是以这些向撖为列 
的 矩阵. 因为标准正交性和等式=仰，矩阵的第一列有元紊 闵 
此，除丫 WAV , 的第一•列中第一个元索以外，所有元家必须为零（第一个元素也可能是 零）. 




[203] 如果用分块形式把这个矩阵写成 


VMV, = 


T 

a 

-0 A ? - 


e c n \ a 2 e 




(4. 4. 3 a ) 


我们看到 


(VMV.HVTAV.) = V ； AAV, 


'a 2 cnv T - j - u> T A2 1 
-0 A 2 A 2 」• 


W 此， AA 的诸特征值（根据假定它们都是非 负的） 是 〆 以及的诸特征值.由此得出，通 
过这个简化过程所得到的矩阵 A 2 € M „ ,也有使的所有特征值都非负的性质. 

现在可以对于 A 2 及其后继矩阵重复实施上述简化 过程. 至多经 n -\ 次（正像在 Sch lir 三 
角化定理 （2. 3. 1>的证明中所做的那样）便得到 






其屮，4是 H 有非负主对角元1 的 上三角 矩阵.如果令则有 A = LMLT ， 这 
正是所欲求的. □ 

练习 .11^ 对矩阵 A = U 实施定理（4.4.3>证明中的汁 W , 并证明 A = 其中 


A = 


；]• - 4 ： :} 


L 0 0」， V /2 L ， 1」 

如果《>2，并非匈 A (- M n 都有使 AA 的所有特征值均非负的性质, A - 

[j j 就 M —个简申的例/ m \(\] . 定 i ?<4.4.3> 与 Schur 三角化定理 （2.3. I ) 只是 部分类 

似_每个 A 6 iW N m 了经形 tJA — 〖/ AL 7 •的变换（其 中汽 矩阵以€“> 二 :角化，不过，只有使 AA 有 
全部作 负特征值的那些矩 K AC M , 可经形如 A - LMLT 的变换（其中酉矩阵三角化. 

每个对称矩阵•有如下 性质 ： AA = AA •的所有特征值都是非 负的. 该特殊形式已 
包含4:定理（七 ‘1.3” p ， 人们通常把它归功于 Schur ( 1945). 但是较 早的证明是由 Hua 
(1944 )， Siegel (1943〉和 Jacobsen ( 1939) 提 出的； 而历史的优先权显然应该厲于 Takagi 
(1925). 


IM ] 4. 4.4 推论 （ Takagi 分解〉 如果是对称矩阵（/ \ = / T ) ，则#在酉 S •:阵和非负实 
对角矩阵 "•• 心）使得 A = [72 U ' L / 的诸列是由的特征 向摄组 成的标准正交 
组，而2的相应对角元是九5的相应特征值的非负平方根. 

证明： 如果 A = A 7 ， 则忑=/\.，且 AA = AA 、 如果 o * 參0是 Herniite 矩阵 AA •的任一特 
征向 ft ， K AA - j = Aj , 则 i = ( A . W W 为 : y •: y >0 对所有 

yecr 成立，而 ，: y = 0 当且仅当夕= 0，所以有 A = ( A * y (个 aOAr ： r >0. 因此，只要 A 是 
对称 矩阵， A 3 的所有特征值都 为负. 定理（4.4.3)保证存在西矩阵17€^/„和 t 三角矩阵 



e 接阵和对称矩阵 


△ 其中 


A = 


所有 A > 0, 


使得 A = ( JM / T . 但是 W 【 J T = A = A T = LM T L / T ， 《而4 = ^,这只有在厶是对角矩阵时才 
能成立，根据构造，△是非 负的. M 后， AA =【^ U T CSLT = l /2 2 L ； •是 Hermite 矩阵的酉 
对角化， W 而， L / 的诸列是 AS 的特征向域. □ 

形如的任一矩阵，其中 A 是对角矩阵（不一定非负），显然是对称的，因此，为 f 
使某个矩阵能分解成 • A = CMC / t ' = CMD '= LMD 〃， 其中， L ； 是两矩阵，而 A 是对角矩 
阵，其必要充分条件& A 是对称矩阵 . 在定理 （4.6. 11>中给出了 A 可以分解成 A=SAS 1 的 
条件，其中 A 是对角矩阵，而 S 是作奇异矩阵（但不一定是丙矩 阵）. 

毎个«矩阵 A€iVt 可以写成形式 A = V 2 W • 其中， V , 是两矩阵， | fij 2 是具有 

非负主对角元的对角矩阵.这就是奇异值分解，将节中讨论它. Z 的诸对角元足/\的 
奇异值.关于（可能 是复） 对称矩阵的 Takagi 分解 A ^ IJ2U T 是关于对称矩阵的特殊竒异值分 
解，其中 

在定理 （ H 3> 的证明中所采用的构造性方法可 以用来 汁算复对称 轵阵的 Takagi 分解.因 
为 A 的对称性，所产生的矩阵△将 S 然对角矩阵.见本节末习独 9. 

练习迕接对矩阵 A=[j 2实施定理 （4. 4. 3) 证明中的计算，并证明 A = LMU 7 , K 中， 




\/4 + 2>/2 


汴意 ， d A 然是对角矩阵. 

由 f - Takagi 分解 A = [； VL / 7 中 fi W 子 U 的诸列是 Hennite 矩阵.心\的特征向请， 这珂能 
会误认为，如果•是两对角化的.则 A = L /2 U 7 '. 实际情况不一定如此 • 考察例子 

A== I ^便可矜出这 一点. 因为/,所以对仃何 2 X 2 实正交矩阵 Q , ^ AA QPQ 1 ， 

而 Q / Q f = / 关 A , 问题足 AA 有亟数大于1的特征值，而 AA 的任一特征向最都不可能有 A ; 
的性质：这个特征向 M 不可能给出 A 的所欲求的化简.如果考虑基向量则 AAe , == 
\ t \] A ei = A ei = e 2 ; 十是有定理 （ 4. 4. 3) 证明中的情形 （ b >. 根据证明，可以取比= 
Ae } -i \ e ] — e 2 -\- e x , 这便得到向 M v = v , = ( q + p 2 >/ V ?， 它能化简 A . 因为 v 2 = (q — 与 
V 、 正交，可以取 

u 

ri oi ri oiri oi 2 

并且得到 V T AV = 1 = 1 , ^ = ID 2 . 因此，如果令 

L 0 ― 1 J L 0 1 J L 0 j J 
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U = VD = M; 

则/ \ = 是 A 的一个适当分解.应指出的是，实对称矩阵的1、1^只1分解（4.4.4)不可能有 

实 W 子. 

刚才所讨论的例子中的闲难以及在一般情形中的困难是由 的里特 征值引起的.如果 
AA 的所有特征值是不同的，乂如果采用 （4. 4.3> 证明屮的构造法来计 算复对 称矩阵/\的 
Takagi 分解，耶么，总有情形 （ aK 见习题 9). 在这种 情形，九4的每个特征向 M 了有 性质; 
对满足“=狀 2 ' 和•的某个 “6 C ， 有九 r = “. r . 因而，如果 AA = V 2 2 V •是 

Hermite 矩阵的西对角化，则必有 AP = V 2 D ' 其中 D 2 = di ag ( e * 2 ' tf > ,…， e 、 > •• 只要知 
道了 V 和2(2 2 的非负平方根 K 这个恒等式就可用来计算相应于2的非零对角元的 D 2 的对角 
元.相应于2的零对角元的 D 2 的对角元是任意的，且可以取为 + 1. 敁后， 如果令 L / sVD 和 
D = diag(Zs …，则有 A = A 9 V r = V 2 D 2 V r = ( VD >2( VD> T = L /2 l / r . 我们把这些论断 
m \ 总结成下述推论. 

4.4.5 推论如果 A 6 M ， 是对称矩阵，且 AA 的特征值互不相同，乂如果 /\A = V ^ 2 V •是 AA 
的西对角化,其中2=出》8(心，…， < r ,> 且所有则存在对角矩阵 D = diag (， ，…， 〆 ') 
(其中所有 A 6 R ) 使得 A = ■(其中 L / = VD ). 相应于 2 的非零对角元的因子 D 的对角元由 

关系式 = •’确定：相应于2的零对角元的 D 的对角元可以取为 + 1. 

如果是对称矩阵，并 M 利用 （4.4. 4>把写成/ \= L /2 L / r , 也可以把它写成/\ = 

( Ul ll 2 )( UI ri ) T . 其中 2 l2 = di a g ( + y ^，+&,•••, 〜 J 7 丄 这番论 证构 成下述推论的 
证明. 

4.4.6 推论设/则 A 是对称矩阵，当且仅当存在矩阵 S 6 M " 使得/\ = 乂 S ' 可以选 

取 .S =【/ f )， 其中 L ； 是丙矩阵. D = diag ( v /? T ， sfo : •、…、 y ^), rfii (7 •是 A 的奇异值 • 在这种 
情形， rank S=rank A . 

虽然实对称矩阵是正规的，但非实复对称矩阵不一定是正 规的. 如果 A = i 3 十, C 6 M , ，其 
中 B 和 C 是实矩阵，则 A 是对称矩阵 • 当且仅当8和 C 都是实对称 矩阵. 如果 A 既是对称矩 
阵，乂是正规矩阵，则 

AA - =(妒 + C 2 > + i((:fl — BC ) = ( B ? + C -) + «( BC - C ； B ) = /T A 
由此可以推出 B 与 C 可交换.在这种情形下， B 和 C ： 可经实正交矩阵 Q 同时对角化.如果 B 
^■ QhQ '， aC = QD 2 Q r , 其中 D , 和 D 2 是实对角矩阵，则 A = B + l C = QD l Q T + / QD 2 Q r = 
Q ( D ,- l - iD 2 ) Q r = QAQ r , 其中 AsDi + iDz . 反之，如果矩阵 可写成 A = CMQ r , 其中 

Q 是实正交 矩阵， 而 A 是对角矩阵，且 AA ，= QAQ t QAQ t = Q \ A \ Z Q T = 
QAQ r QAQ T = A ' A , 因而 A 既是对称矩阵，乂是正规 矩阵. 这就证明了下面的定理. 

4.4.7 定理设 A 6 M ”， 那么， A 既是对称矩阵，乂是正规矩阵，当且仅当存在实正交矩阵 
QeR ( R ) 和对角矩阵使得 A = QAQ r . 

一个既对称又正规的复矩阵的简单的有用例子是 



阵和对称矩阵 
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S = g(J + !S)， 


其中 B 是“后向单位”矩阵 


B = 


它呰在 （3. 2. 3) 中证明每个矩阵相似于它的转置时起过作用. 

因为皮=/,所以 

.SS = y(/ + /B)(/-iB) = + = /, 

由此可知， S 既是对称矩阵又是西矩阵. 

现在考虑具有零主对角线的标准 JordwVc 人（0>, ^2,把它写成形式 

卩1 01 


6 M k 


经简单计算可知 


(4. 4.8) 

207 


[ 208 | 

(4.4.8a) 






它显然是对称矩阵.任一 Jordan 块 A(A>a>2) 具有形式 A/+N， 义 SNS * 是对称矩阵，所以 
SJ k U)S itSUZ+AOSMsAf+SiVS- 1 是对称 矩阵. 

每个矩阵汷 6A1 都相似于它的 Jordan 标准形 _/(3. 】• 14>，其中 e = 2, 且 J='U ,， 2)® 
…㊉2> 是修改后的诸 Jordan 块 J„ (A,, 2> 的直和.这个论断（它相当于在上述论证中用 

2/V 代替 N> 允许我们略去（4.4.8«>中的系数因子|.当时，如果我们设 \ e ( 1A/^ (/ + 

出)是形如(.1.4.8)的化/^|,矩阵， H. S,-[l]； 如果令㊉… ®S„ 4 , 则上述论证说明， 
TJT 1 = T7T = (S (1 ,J 、 U l ,2>S <t ,>@m@(S % J 、 CU ， 2)S l% > 

足对称矩阵的 A： 和. W 而是对称矩阵. W 为每个叉是两矩阵，所以矩阵7、是两 矩阵， W 此已 

$ 

经证明，呈 Jordan 标准形的每个矩阵等价于一个对称 矩阵. 因为每个矩阵相似 Jordan 矩阵， 
故已经证明 r 下述定理. 

4.4.9 定理•每个矩阵相似十对称 S«: 阵. 

实际上，已经证明每个矩阵相似于对称 Jordan 标准形 S W| a) ㊉ …①其 
中,如果义=£» + 1，且 a, pe R B'J 

S*(A)= SJ k (X.2)S = XI + SNS 

•0 1 01 0 - 1 O' 

, 1 o ••• ••• 1 

=A/ + . • +，• ••• 6 M,, 

1 一 1 •• 

• • 

0 io oi o 

■ 

且 S 由 （4.4.8> 给出.注意 

=「 a ] 而 s 2 ( a > = 1 

- 1 A + / - 

_ W 为这种形式是 ft 接从 Jordan 标准形推导出来的，所以它的唯一性与 Jordan 标准形的唯一件 
相同. 

这个结论的一个推沦是，关于复对称坧阵的谱、 jordan 块、极小多项式、特征多项式或不 
变 W 式都没冇任何特別的结果.如果这鸣 M 中任何一个可以出现在某个阶数的对称矩阵中，则 
它也"I以出现在同阶的一般复矩 阵中. 中的每个相似类包含一个对称矩阵， CT 上的每个线 
性变换冇一个对称的基表示，矩阵的对称性只不过是为表示相应线性变换而选定一个特殊的基 
的人为 现象. 另一个推论是 • 每个矩阵在某种意义下“可对角 化”. 

4.4.10 推论设 A6M,, 已知.则存在非奇异矩阵 S 和两矩阵 L；， 使得 （L；S>A(&S) 1 是具有 
非负对角元的对角矩阵. 

证明： 利用 （4. 4.9) 求非奇异矩阵 SSAS 1 是对称矩阵，然后利用 （4. 4.4) 求西矩 
阵 U 6 使 L7( SAS- 1 )LT r 是非负对角矩阵. ： j 

定理 （4.4. 9>同时 推出； 每个复矩阵相似于它的转置，且每个复矩阵可以写成两个复对称 
矩阵的 乘枳. 这两个结论对任意域上的矩阵都成立，但定理 （4. 4. 9) 对一般域不成立. 
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4.4.11 推论设 A 6 M " 已知.则存在矩阵 Ce , 使得 C = C T , 且 A = BC . B 
或(：可以选为非奇异矩阵. 

证明： 利用本定理把 A 写成 A=SES \其中 £：=£' 且 S 足非奇异 矩阵. 于是/\ = 
( SES T )( S T ) 'S l =( SES T )( SS T ) l = BC \ 其中 和 C = SS T 都是对称矩阵.又因为 

A = ( SS 7 )(S l ) T ES \ 所以因子 B 或 C 可以选为非奇异矩阵. □ 

Cirarn - Schmidt 过程 （0. 6. 4) 在研究正规矩阵中有许多 应用. 有一个类似的过程对研究 fi 对 
称矩阵是有用的. 

4.4.12 引理设 』 ,•••• ， a6C” 是给定的向埴，且々则存在向 M •… ，： y *， 使得 

SpanU, •… ， j*|=Span{^,, — • v* ) . 并& 对所有 /， ）= 】• 2 ，々及 i •关）冇： y, T ： y, = 0 ， 
对，=1，2， .•• r * Vi 7 v ; = l ， 对/巧卞！ ，…， 々冇 v /* v =0 ， 其中 r =rank X r X 且 X = [ jv ” 
是其列为已知向 MUJ 的矩阵. 

证明：因为矩 钻对称矩阵， Tak « gi 分解定理（4.4.4>使我们可以把它写成 X r X = 
U ， 其中 •【 KM * 是丙矩阵 R 2 — diagUi ，…， rr *>, 而 m … >心+! = 0 =…= 

①， rank X r X = r . 如果令 D = ding ( v / f , … •々;，】，•••• 1) 6 M *, R 记 = diag ( 1 ，…， 
1， 0, …， 0)€ M ” 它有 r 个 1 和务一 r 个 0, 則： = O/D >/ r ( C / D) r = S T f r S 其中 S = DU 7 
楚非奇异 矩阵. Wifri(XS , ) r ( XS -') = / f , 因此，如果令 xs ^ y - Lv ,, w 为 
= 则列向 W . v ■，… • ％具有所要证明的 性质. n 

上述引理叙述的法则形式上类似于 Gram - Schmidt 过程 ， Gram Schmidt 过程是针对 X . X 
lW 不 iiXW 在 Gram Sdmiidt 过程中，对每个 ） =1 • 2,… • 々，每个乂可以作成心，…， 
• r , 的线性组合， 但在 这里可能行 不通. 另一个差別是，在 Gram - Schmidt 过程中，具有 〆 ％•= 

1的向» . V ，的个数等子 rank X ( i # f 无关向 M •!* •的 M 大个 数）， 它等于 rank 但是在这种 

悄形， S ■有/又=1的向琀 . v •的个数等于； TX 的秩，它可能小于 rank X . 

例假定々 = 1，且 • r l = A ：= m 则： V r X =0, 内而 0 = ran kX , 它严格小于 rank X — l ， 

•Vi 只可能是 a 的纯 k 倍， W 此不可能选取力使得 Sp an U ,} = S pan 彳而又 

例假定々 = 2 , = = •则 rank X T X =2, 并 M 存在向 M %， 力使得 

X %， v ^^ Spanfx ,, J * 2 >&^. = 1=^. 因为 所以不可能 选取; y , 为： r , 的 

纯坩倍. 

我们所考虑的直接应用是针对酊对角化复对称矩阵的特殊情形的.如果4 = 且 

、其中，对角矩非奇异矩阵则显然不能从这个通常的对角化表 
示推出 A 是对称 矩阵. 但是，如果 S 是复正交矩阵，则 S _ ! = S r ， 且 AsSASWsSAf 显然 
是对称矩阵.下面的定理说明，总可以选取 S 为复正交 矩阵. 

4.4.13 定理设是对称矩阵，则 A 可对角化，当且仅当它可复正交对角化，也就是 
说， A ^ SyUS 1 对于对角矩阵 aGM ” 和非奇异矩阵成立当且仅当 A = CMQ r , 其中 Qe 






2 l 2 


M ” 适合 Q 「 Q =/. 

证明： 假定 A 二乂设 h . veer 是 A 的特征向 M , H . Aa = A . r , Ay =^ y . 如果 A 关户， 
则 y 1 Ax = y ' Xj - = Av r -r * H . v T As = ( Ay ) r .r = (^ v > ’ r = / jy \ r , 因而 Xy T x = fiy'x . 乂 因为又 / 
/ i . 所以 .vV = 0. 这只不过 是把叹 if . 交件原理 （1. 1.7> 应用 f 对称矩阵.如果 A 是可对角化的， 
a /\ = SA.S 不夫-••般性.假定 ft A =^,© … © A ,, 中. A 的相同特征值排放在一起，其中 

/\,= A ,/ 6 M „ , ”,+ — + "•/ R 当 i^j 时 A . X •把 S 的诸列块分成… 

使之与 A = … © A ,, 分法相 M . 于 对， =1, 2•… ，么 S , 6 M n , N . 由双正交性质， 

j 

如果/ 乒， 则、 • W 为 S T . S 是非奇异分块对角矩阵，所以，对所有，=1, 2. 

4 $ 

…， a ， WS , 非夺异.由丁扭个矩阵 . S / S , 是满秩的，引理 （4. 4. 12) 说明，每个 S , 的诸列可以 
用新列来代衿，它们是诸旧列的非夺异线性 纽合. 且彼此复正交：即存在非奇异矩阵尺 6 M „ 
使 Q •安 S . R •适合 QfQ ! = RW . R . = K M 、 ,因为对所有 Q ! Q t = R ! S ! S , R ,=0, 乂对 
/ = 1. 2. c /- AQ ^ ASM .^ X . S . R ^ X . Q ,. 所以矩阵 C ^ CQ , M n 是复正交的 ， fl 

A = QAQ r . □ 

上述结论可 对定珅 （丨.七7>作出很好的 解铎： 对称轵阵 .4 可对角化，当 且仅当 A = CMQ r 
fLQ 是 复正交矩阵； 乂 A 是正规矩阵 • 当 il 仅3 Q 可以选为实 IF . 交矩阵. 

可以对定理 （4. L 13) 中的结果稍作 推广. 若 A , Z 36 M •是对称矩阵，则 A 与 B 相似当目. 
仅当它们可以通过复 IE 交相似来实现相似.事实上，假定存在一个多项式 />(/) 使得 A t = />( A ) 
旦 /r = />( B ), 在这个较弱的假定下上述推广成立.见 [ HJ ]. 

习题 

1. 假定足对称矩阵 • RA = B + / C ：, 其屮 / i , 都是实 矩阵. 证明， A 进正 

规矩阵，当 EL 仅当《与（’ 珂交换 • 证明 • A 是正规矩阵 • 当且仅当 AA 是实矩阵.证明，/\ 
是正规 矩阵， 与 R 仅当 A 与 A 可 交换. 给出一个对称矩阵不是正规矩阵的 例子. 

2. 下面给出推论 （ 1.4. B 的另-个证明的要点，作详细的 论述. 记号和假设如 （4. 4.4) 
中所述.若 A 是奇 异的， 设 •••• “dS A 的芩空间的一组标准正交基 at ； = […… 

…〜]&两矩阵.则 

「° .Ve M . , . 


a ，e 


LO A'J 、 “ 

其中 A ' 是非奇异对称矩 阵. ㈨ 此.不失一般性，我们可以假定是非奇 异的. 设糸 =/3 + 1 , 
其中 K r ；© 实矩阵，且设 e = _r + /. v ec ' 其中 .r, .V e R ". 乂设尸=「^ __ C ], ^ = 


其中 (’；© 实矩阵，设 = = _r + /. v eC \ 其中 . r , .v 6 R \ 乂设 i = 

— （ a ) B . r 和 F 是实对称矩阵. i 寸论 / U =( B 十 C 〉( j + Lv ) 与 K 之间的关系 .（ b ) 

F 是非奇异的. 提示： 苦 Fi =0. Az 是 什么？ （c) 若 F 二 ^| = 4— j ， 则 

可以把 f •的非 零特征 值按一正一负 配对. （ d > 设 F 相应于其正特征值 A , •…， 夂的 标准正交特 

征向 Mi 己作 Lsf i ’ jeR ' /= i ，2. •••• ”，设 x 三|>,...心]，又设 2 


征向 Mi 己作1 = 
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= di a g ( A ,， …，关于实对称矩阵的谱定理是指其中 

d] 

且 V 是实正交 矩阵. （为什么？）设证明 L ； 是两矩阵且 L ；2(/ f == A . 

3. 当 A 是实对称矩阵时， U . 4. 4) 说的是什么？它与实对称矩阵的通常谱分解有何关系？ 
提示： 如果 A = QAQ f , 其中 . A 是实对称矩阵，而 Q 是实正交矩阵，把 A 写成 A =2 D 2 且设 
U = QD . 什么时候 Takagi 分解 A = U 2 U T 中的所有因子可取实矩阵？ 

4. 如果 A = U 2 L ^ eM „， 且 U 和2如(4.4.4> 中所述，试通过直接 H 算证明，^是 AA 和 
的特征值，且 AA 和是 Hermite 矩阵. 证明 C ； 的列％和数久适合方程 AG , = cr ,«, ，/=1，2, 

或许因为这个理由，冇时称 a , 为 广义特征值， 不过，术语奇 异值似 乎更为通用. 

5. 假定是对称矩阵，设5和 U 如 （4. 4.4) 中所述，且把 A 的诸奇异值 a 排成递减 

顺序〜 彡办& …彡久 >0. ( a ) 试修改 Rayleigh - Riiz 定理 （4. 2. 2> 的证明来证明 a ^ % = tr , = 
max { I I / x ' J -： 0^- r € C "(, 即类似于 （ 4. 2. 2 ) 中的上界，复对称矩阵有相应的论述. 

试考虑 L / 的第1列来 证明， 该极值由适合九/ =<；^的申•位向 M 来 达到. （ b ) 试考虑 A = 

和来说明，在这种悄形， o nun =^ 7 ^ mini I x 1 Ax I / jcx ： 0 ^ j 6 C "} • 因而，类似于 


(4.2.2> 中的下界，对复对称矩阵的相应论述不 成立. （ c > 试考虑 A =/ 6M 2 


， w =\ l 来说明 
L; 


max { I x'Ax | / xx ： 0^ x 6 C , * r 丄 u ，}=0. 由此得出，类似于 CouraniFischer 极小极 大公 
式 （4.2. 12>，对复对称矩阵及其夺异值的相应论述当 A >1 时不 成立. 但是，可以 看一# 
(7.3. 10). ( d ) 类似于极大•极小公式 （4.2. 13), 关于对称矩阵的相应论述是什么？ （ e > 设2 = 

) |]^« == ^=>/2), iWA = [】 l ( cy , = l > 是_去叉的 M 后一行和射后一.列后形成的矩阵.注 


意，类似于 (4.3.9 K 交错不等式是不成 立的. （0 不过，还是有关于加边对称矩阵 
的诸奇异济的不 等式. 设对称矩阵且有奇异值 〜 ，而•(有奇异值 
①彡…>义）是删去2的一行和相应的列形成的矩 阵. 试用定理 （7.3. 9>证明， '心 ， k 
= 1 ，…， »:( o ,，：= 0 ). 对于 （ e ) 中的例子验证这些不等式，然后把它们与关 f 加边 Hermite 矩 
阵的诸時征 ( S 的谘交 沿不等式 （4. 3. 9) 进行比较. 

6. 如袼/\6从《 S 对称矩阵，乂如果 A =(；2 U r , 其中， （； 是西矩阵， 2 = diagU ,, 心， 
…，〜）， il 所有 a •夕 U ， 证明 A 的秩等于非零 项1 的个数 • 提示： 如果 B . CeM , 是非奇异 
矩阵，则 rank / I — : ank HAC . 


& A 其中 B ， C 是实矩阵，又设 


( a > 证明，； L 4 


B 2 +C 2 + i(BC-CB), K 


叫 - 

(1)) 证明 S =( lA/?)[〜j ^ 


b 2 +c 

( BC - CB ) 


BC ： - CB 
B 2 -f C 2 


參 


是西矩阵. （ c > 证明 . SF 2 9 = 


AA 0 
. 0 AA 


■ 

— 



( d ) 证明 F 的诸 特征值的平方就是的诸特征值 及其复 共轭. （ e > 如果 A 是复对称矩阵， 
证明， F 是具有实特征值的实对称矩阵，户只有非负特征值，且 F 的特征值平方的集合与 
Hermite 矩阵的特征值集合相同. 

8•设是复对称 矩阵. 考虑二次型 </ A (_ r ， h =* r T Ar 和由 A 生成的双线 
y) = x T Ay. 试用推论 （4. 4. 4) 证明 

sup 丨 q A (jr,x) | = sup | b A (x,y) I = . 

J I x 1 

• v .，- I 

其中 a m „( A ) 是的最大特征值. 

9. 试用 （4. 4 . 3) 的证明中的 i 己号证明下列命题： （D 如果 A 是 AA 的单特征值，且1參0适 

合 A>\«r = A * r ， 则 Ar 与 j •相关. 提示： 设 ( j =+ vTM •令 xt ，= — 证明 Aui = 一 < yx ^ 和 A Aw 
= Au>， 因而 Tt ，是 j * 的纯域 倍数. （ ii ) 如果 A = 则 ㊉ A.， ； 即 （4.4.3a> 中行向 M 
W 是 零. 试用它来证明，这个构造法 A 然产生矩阵巧•… VrAV ^ VV ..^ 

△是对角矩阵. 

10. 设且假定有非奇异矩阵使得汽•，其中 A 二 diag(A, •…， vU. 
证明， AS 可对角化， fi 它只有非负特征谊，并 R nmk A = ran k AA . 这与 （4. 4. 4 > 有什•么关 


? 说明? j 都不能写成这种形式. 

»V/ \J L I I « 


11. 如果 S 6 M ” 是某个矩阵，证明，一般有 rank • SSgrankS , 也可能冇 nmk S 3 < ra nk 
s . 如果 s 是实矩阵，会出现什么情形？ 提示： 考察 s = p . j . 

12. 如果 A € M ” 是复对称矩阵，乂 j*，fi A 的相应于 A 的不冋特征值的特征向蛾， 
证明1\ = 0.这说明 o * 与夕正交吗？ 提示： 考虑/(.、.）= (九 r ) 7 > 

13•如果是对称矩阵， ft 有”个不 间的特 征值，肓接证明存在非奇异矩阵 SeM 
和对角矩阵 D 使得 A = SDS \ 提示： A 可对角化，因而 A = SAS 1 巨 AS = S 九根据习题12, 
53 = 0是对角 矩阵. W 此 SMS =、 S ' M=rM ftA = (S ^(/Ma •• 为了证明有复正交矩 
阵 Q 使 A ^ QAQ 7 , 需作哪些修改？ 

14. 如果是非奇异对称矩阵，证明 A 1 是对称矩阵. 

】5•实对称矩阵是 Hermite 矩阵， 因而 可对 角化. 说明复对称矩阵不一定可对角化.提 


示： 考察 A 


= 1 :]并 i 


并计算/ V ’. 


16. 设证明， A 是对称丙矩阵，当且仅当 A 可以写成 A = QAQ r , 其中， 
H ,( R ) 是实正交矩阵，而 A = diagU , ，… • A w ) = diag (^>,— , 〆，■ >，并且对々=1，2， …，； 2 
有 U * I =1 和 

17 - 试用习题 16 证明，矩阵 L7GM ” 是对称的西矩阵， 当&仅 当存在酉矩阵使得 U 

= W r . 

18 - 我们已经证明每个矩阵相似于一个对称矩阵.每个矩阵相似于一个 Hermite 
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矩阵吗？相似于一个正规矩阵吗？ 

19. 利用 （4. 4.9) 证明每个矩阵相似于它的转置. 

20. 证明定理 (4. 4.9) 在实数域上不 成立； 即不是每个矩阵 AGJVUR ) 都相似于实对称矩阵. 

21. 复对称矩阵 A 可能有迷向向 Mt ; 作为特征向 tt ; 即， = v 关0,且 v \ = 0, 但 
是，如果 A 可对角化，证明 A 不可能是单特征值. 提示： 一方面把 A 写成 SAS — 1 ， 且^为5 
的第一列，另一方面证明，因为 S T S 的第一行为芩，所以 S T S 是奇异矩阵.特别是，如果 

C 是使^% = 0的任一向 M , 则（秩1>对称矩阵 A = t ^/ 不能对角化.参看习题 15. 

22. 对推论 （4. 4.4) 的另一个证明的下述要点给出详细的论述.记号和假设如 （4. 4. 4) 中所 

述. 这实质上是 Siegd (1943) 的 证明. （ a > AA 是 Hermite 矩阵， W 而存在一个酉矩阵 M „ 
和一个实对角矩阵使得九 ( b)V 既是对称矩阵又是正规矩阵，所 

以，根据 （1.4.7), 存在一个对角矩阵 A 6 A 1 和一个实正交矩阵 Q 6 MJR ) 使得 B = C ^ CJ T . 
(c)A = ( VQ ) A ( VQ ) t . 现在 ic!A = £2 E T ， 其中，乏均为对角矩阵， & 乏是非负矩阵，于 

其中 【/ = VQE 是两矩阵. 

23•设々，…，是 ，，个 复变械的向 M , 又设 / U ) 是在某 个区域 DCC ” 中 h 
个«变 M 的复 解析闲数. W 为混合偏导数相等，所以 H = [ f // 士，戈]在毎•-点是对称 
矩阵. （4.0.3) 中的讨论说明，可以假定一般线件偏微分算子 



中的系数矩阵 A = [ u ,, l 铤对称的，证明，在某一点 存在变 Wz — L ；? 的酉变换，使得在 
新坐标系 K /./ 在〜是 对角的，即 

Lf = ~^， 在2 = z 0 • A > < T 2 > …> 0. 

24. 利用 （4.4. 13>以及类似于在 （1.3. 19>的证明中所采用的 !)1 纳证法，证明下述命题.它 
与同时丙对角化一个 Hermite 矩阵族的定理 （4. 1.6) 类似： 设況二 At 是给定的可对角化对称矩 [2 T 6 i 
阵族.则对于所有久存 AS 正《矩阵 Q 使得 QAQ T 是对角矩阵，当且仅当分是交换族. 

25. 利用定理 （4.4. 7> 证明中的证法证明 • 矩阵 A€M n 既是斜对称的 （A = — A T ) 乂是正规 
的，当旦仅当有实正交矩阵 QeAMR ) 使得 = 0 ㊉0㊉…㊉ 0©A,®A 2 ㊉…㊉ A*， 其中每 
个有形式 

「 0 zn 

= ， 2, e C， j = 1，2,…，々• (4. 4. 14) 

L— z , 0」 

提示： 考察 A 的实部和虚部，并利用定理 （2. 5. 15). 什么时候 1 X1 零直加项不出现？ 

26. 利川习题25以及习题22中的论断证明一个类似 f 复对称矩阵的 Takagi 分解 （4. 4. 4) 的 
复斜对称矩阵的 分解： 矩阵是斜对称的 ( A = — .4。当且仅当存在一个两矩阵使得 

A = (7(0 ㊉…㊉0㊉ A © …㊉ A 4 )(7 t , 

其中每个 A,6M„ 有形式 （4.4.14). 特別地，可得出一个斜对称复矩阵的秩一定是偶数 • 

27. 设是给定的丙矩阵.证明 • K 荧适合 W r A = AW , 就一定存在两矩阵 
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VXK 使得 V 2 = VV 和 提示： 如果 W = 其中 （； 是酉矩阵 ， A = diag (^' , 

… ，，）， aO<^<2ir, 考虑自然平方根 AW = diag (，' 2 , …， e ' /2 ) ，且设 VeJM ■ • 
证明当且仅当 A 与 L / 7 At ； 可交换.或者利用 （1.3.12) 证明中的证法证明， V 是 W 
的多项式，由此推出 A 12 与 L/ T AL7 可交换，因而 VM=AV. 

28. 对推论 (4. 4.4> 的又一个证明的下述要点给出详细的 论述. 记号和假设如 （4. 4.4) 中所 
述.这实质上是 Hua (1944) 的证明.首先假定 A 是非奇异的. U ) AA 是 Hermite 矩阵，且它 
是正定的（对所有 a :' AAx =( Ax )' ( Aa )^ O ), 因而存在一个两矩阵和一个非 
负非奇异对角矩阵使得 AA = Zd . ( b ) W =2：- l Z - A 2 是酉矩阵且是对称矩阵， 
因而 ( c ) 利用27题证明，存在一•个两矩阵使得 W = W 且 2 \^ = \^ 2 . ( d ) 
Z - AZ = IW=IV = ( IV ) V = V T IV , 故 A = ( ZV r >2( ZV ^ r . 设以= 21^. ( e ) 若 A 是奇异矩 
_ 阵，利用习题2开头的论断把 A 化为非奇异的情形. 

进一步阅读与注释关于推论（ 4.4.4> 的原型既可参看 T.Takagi, M ()n an Algebraic 
Problem Related to an Analytic Theorem of Caratheodory and Fejer and on an Allied Theorem 
of Landau, M Japan. J. Math. 1 ( 1925 )， 83-93, 也可参 # I. Schur. •• Ein Satz liber 
Quadratische Formen mit Komplexen Koeffizienten.^Amer. J. Math. 67 ( 1945), 472-480 •另 
给的几个证 明可参看 C. L. Sitigel ， M Syn»p!ectic Geometry 9 n Amer. J. Math 65 (1943 )， lemma 
1 ， pp- 12. H !5* I- "K. Hua* "On the 丁 heory of Automorphic Functions of a Matrix 
Variable 1-Geometric 99 Amtr. J. Math. 66 (1944) ， 470-488 : 及 N. Jacobson, “Normal 
Semi-Linear Transformation Math. 61 (1039), 45-58. 用三角约化 （ 4. 4. 3 ) 证明 
(4. 4. 4>^1 参肴丫 . 卩 . Hon^ am! R. A. Horn, M ()n the Reduction of a Matrix to Triangular or 
Diagonal Form by Com;imilari!y • j. Algebraic and Discrete Methods (to appear). 关于 

推论 （4. 4. 11> 到任意域的推广巧 参香 （>. Triussky • “The Role of Symmetric Matrices in the 
Study of General Mair\ce \/ Linear Algebra Appl. 5 ( 1972), 147-154. 

4.5 Hermite 矩阵、对称矩阵的相合与同时对角化 

任一二阶线性偏微分算子 /• 可以写成形式 

^/= + 诸低阶项 • 1 = 0,] G DCR \ (4.5.1) 

其中，假定系数“ v (_ r ) 定义在某个 区域 DCIir 上，函数/在 D 上二次连续可微.正如在 
(4.0. 3) 所看到的那样，我们不妨假定，对所有系数矩阵= 是实对称矩 

阵.我们所说的低阶项指的是只包含/及其一阶偏导数的那 些项. 

如果作 A 变量到新变 M s = 的非奇异变换，则每个\ = 5 ,0]=^,(^，…， 

A ), 而非奇异性则说明 Jacobi 矩阵 

心 =[-穿 > 紙 

_ 在 D 的每一点非奇异，这个假定保证变 M 的逆变换局部存在.直接应用链法则可证， 

IJ 8] 在这些新坐标下，算子 L 有形式 
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… 訊自 ，老％最 hfV 诸低阶项 

= 十诸低 阶项 . （ 4.5.2) 

因此，（在坐标 s = [>,] 下）新的系数矩阵 B 与（在坐标』 •=(>,] 下〉旧的实系数矩阵 A 的关系可 
用关系式 

B = SAS T • (4.5.3’) 

表示，其中 S 是非奇异实矩阵 . 

如果微分算子 L 与某个物理 定律冇 关（例如， Laplace W 子/. = \^和静电 势）， 尽管对 fl 变 
M 的坐标选择显然会影响 /. 的形式 • 但它决不会影响该定律. W 此，我们不禁要问，通过关系 
式 （4. 5. 3 1 〉与已知矩阵/\相关联的所有矩阵 B 的集合具冇什么不变 W. 

另一个像 （4. 5. 30那样的变换例子来 源于槪 宇与统计.假定 ft 有期审算子/：的某个概率 
空间上 • X ”…， I 是具有二阶矩的实或复随机变摄， M 设 / i , = E (兄）表示相应的平均 
值 . Hermhe 矩阵 A = [ 〜1 = ( E ：[( X , — 〜 >( 尤一 A )] > = Cov ( X > 是随机向 tf ： X = [ X ,, 

X„] T 的协方差 矩阵 . 如是给定的矩阵，则 S.Y 是其分械为 .Y 的诸分《的线性 
组合的随机向 M. SX 的诸分 贵的平 均值是 

E((SX),) = E(^s,X k )= = E 

而 S\Y 的协方差矩阵姑 

Cov(SX)= (E[((SX), - f ； ((SX),))((SX) ; -K((SX) ; ))]) 

/•- 丨 V-l 

M r | 

=( 2 —^)( X y ~/7 W ) 1- v ^ )= ( E 〜〜•、、） 

I / »W "I 

=SAS - . 

这说明 

Cov(SX) - .SC\)V(X)S* . (4. 5. 3 - ) 

因此， 随机向 W 的协方差矩阵的变化规律与 （ 1.5.3 卩稍有不同 • 位是，如果矩阵 S 是实的，它 
便简化成 (4. 5.3 r ). 

作为敁后一个例子 • 考虑一般二次呦 

CM.» > = y^a f ,A\.r, ^ .r - 1 6 C’_ • 

I • ， • ， 

以及 Hermite 型 

H 

= V — < Hr . j — [. r ,」6 CT ， 

“i I 

其中 A = U,] 且如果足给定的矩阵，则 

Q.A<Hr) - (Sr) T .\(.Sr> ./ 1 (.S J .\S ).r -- ). 
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H a ( Sx ) = ( Sr) B B ( Sx ) = x ' ( S ' RS)x = Hs -^ Cj ). 

在这个例子中， A , B ， S 和』•为实的或为复的是无关紧 要的.这串 有两种稍微不同的变换 
规律在起作用，而这正是给出下述定义的理由. 

4.5.4 定义设 A , 朽6^^是给定的矩阵.如采存在非奇异矩阵 S 使得 

( a ) B = SAS - ,则称 B 是•相合（“星相 合”） 于 A . 

( b ) B = SAS T , 则称 B 是 7 相合 （ T - 相合） 于 A . 

显然，这两个相合槪念疴定有密切 关系； 如果 S 是实 轵阵， 它们是相同的.当区分这两个 
溉念是无关紧要的时候，采用术语相合，而不加间头.有些作者用术语共轭相合表示•相合， 
而我们采用更便于 i 己忆的术语. 

练习 证明相合的矩阵有相同的秩. 

值得提出的是，如果 A 是 Hcrmite 矩阵，则 SAS * 亦是 Hermite 矩阵（即使 S 是奇异矩 
阵 h 如果/\足对称矩阵，则 S /\ S ^ 也是对称矩阵.通常，对保持矩阵类型不变的相合感兴趣， 
例如，关于 Hermite 矩阵的•相合和关于对称矩阵的 1 相合.但是，如果 A 是实对称矩阵，则它 
是对称矩阵，也是 Hemiite 矩阵：于是 SAS •是 Hermite 矩阵， S /\. S T 是对称矩阵.对于实 
对称矩阵，我们可能想按相关的内容来考虑•相合或 ， 相合. 这两种相合共同 ft 有一个 fi 要的类 
似性质. 

4.5. S 定理•相合和 7 相合都是等价 关系. 即 对任一 A 6 R ， 

( a ) A 与 A 相合. 

( b ) 如果 A 与 H 相合，则 B 与 A 相合. 

( c ) 如果 A 与 B 相合 ILH 与 (： 相合，则/\与(：相合. • 

证明： 对于我们把/\写成/ \ = / A /' 如果/ \ = . SBS _， as 是非奇异矩阵，则 B = 
s l MS 最后，如果 A = 且 B-W mA ^( S l S 2 ) C ( S l S 2 )\ 对于 T 相合的 

证明形式上是相同的. □ 

因此， 所有” X”矩阵的柒合按相合关系划分成等价类.作为一个理论问题，可以在每- 
相合关系下找到毎个等价类的一个标准代 表元. 这个问陕对•相合更复杂一些，所以先讨论这 
种情形. 

通过识別相合关系的诸不变 W 可以辨认并划分各微分算子 • 这个实际问题促使我们*分析 
研究由（经实矩阵 S ) 相合丁•某个矩阵的诸实对 称拓阵 组成的等价类的标准代表元问题.结果证 
明，这个问题有一个简单的解答：只要计算正、负特征值和芩特征值的个数. W 为这个理由， 
引进下述专有名词. 

4. S .6 定义设是 Hermite 矩阵. A 的價性是有序三元组 

i ( A ) = (|, ( A),r ( A ),/ 0 (. A )), 

其中， KA ) 是 A 的特征值的个数， ，• （八>是 A 的负特征值的个数， &( A ) 是 A 的零特征值的 
个数，并且都 计相® 特征值的 个数.注意. A 的秩等 f /，（々> + / ( A ). A 的符号差等于数值 
U ( A )-/. ( A ). 
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练习 证明，如果知道 A 的符号差和秩，则 Hermite 矩阵的惯性是 唯一确 定的， 
反之亦然. 

如果 AeK 是给定的 Hermite 矩阵，则 A = IMCT ，其中 A = diag ( A , ， …， ； U ) 而是西 
矩阵 • 为方便起见，假定 A 的诸对角元中首先出现的是正特征值，然后是负特征值， ft 后是零 
特征值.于是， Ai ，义2，…， A , >0, . ♦,，•••，<0，而 〜 + i 如果令 

0 = diag (+ yJ 7, …，音 \/^7, +>/ _ 义，…，久 , ，“-，1 ，…，1 ) 

则 d 是非命异实对角矩阵 ， a 



其中所展示的矩阵恰好有 I ' ( \)项 “ + 1”，*• ( 4:，“一1”和八(八)项“0”.于是，矩阵 A 可以写成 



其中 S == t 7/) 是非奇异矩阵，而 /( A ) 是/\ 的慣性矩阵. 因此，每个 Hermite 矩阵•相合于一个形 
式很简单的对角矩阵，只要知道了该矩阵的惯性，便知道了这个对角 矩阵. 用惯性矩阵作为•相 
合于 A 的矩阵等价类的标准代表元应当是有吸引力的 • 不过 • 要做到这一点，必须确认•相合的 
Hcrmitc 矩阵有相同的 惯性. 这正是下述定理的内容，通常称该定理为 Sylveter 惯性定律. 

4.5.8 定理 设4，是 Hermik 矩阵，则存在作奇异矩阵 S 6 At 使得/\ = SRS •，当 M 
仅当/\和片有相同的惯件，即有相同个数的正、负特征值和零特征值. 

证明： 如果 A 和 B 有相同的惯性，则每一个矩阵都可表示成形式（4.5.7>,其中每个矩阵 
的 S 可能不同，但却有相 M 的惯性 矩阵. 因为 •相 合关系是传递的，又 A 和 fi •相合于同一个矩 
阵，所以它们彼此•相合，这正是要证的逆命题. 

假定 A 与 B •相合，且对某个非奇异矩阵 S 6 A 1 有.4 = 5衫5' 因为相合矩阵有相同的秩， 
所以 = 因而只需证明 l+ = 设妁 ， ％，…， tv <4> 是 A 的相应于正特 

征值八 （ A >， …， ( A > 的正交单位向撤，另外设 S , ( A ) = S pf mU,, …， r }. 
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S + ( A ) 的维数是 “（ A ). 乂如果 x = a ,%+ …关0，则， A_r = A ,( A > | cn 丨 2 +… 
^ < a ,( A ) | a lf( . A) P >0. 另一方面， 

j- SBS'x = (S-j) 4 B(S-j-) > 0, 

因而，对于具有维数 fV , ( A > 的 SparWS 、,， …，9 M > 丨中 所有非零向最 有: ^ %>0.根 
据推论（4.3.23)，必须有 /* (扪》/, ( A ). 但是，因为 A 和 ii 在这个证明中的作用可以颠倒过 
来，所以得出 “（ B ) = / + ( A >. □ 

练习设八€吣是 Hermite 矩阵.证明. V 相合于单位矩阵， 当目 .仅当 A 的所有特征值都 
是正的. 

练习设 A , 是对称矩阵，证明 .4 和 B 可经复矩阵•相合，当且仅当它们可经实矩 

阵相合. 

练习是实对称矩阵.证明 A 和 B 玎经实矩阵相合，当 R 仅当 A 和 B 有相 
同的惯性. 

练习在由” Xr /复 Hermhe 矩阵所组成的集合中，在•相合下有多少个不同的等价类？在 
由 nXn 实对称矩阵组成的集合中呢？ * 

由于 Sylvester 定理保证在•相合下 Hemiite 矩阵的诸特征值的符号不变，从而完全解决了在 
•相合下从 Hermite 矩阵的每个等价类选取一个代表元的 问题. 但是在•相合下诸特征值的大小如 
何变化呢？利用 Weyl 定理 (4.3. 1)«简单的形式，珂以给出 Sylvester 定理的数嫩形式. 


4.S.9 定理 （ Ostrowski) 设 A, S6M,, A 是 Hermite 矩阵，而 S 是非奇异 矩阵 . 设 A 和 
• 的诸特征值按递增顺序（ 4.2.1 〉 排列 . 则对每个 6=1 ， 2,… ，存在正实数队，使得 A, 
(SS- XftO.CSS- )fl 


X t (SAS 9 ) = 0 t X t (A). 


(4. 5. 10) 


证明：抟先，若 SS\r = ^i •且 了关0， mX = x 9 SS \ r / j - y ^( S \ r )- ( SV )/ x »0, W 而 
的所有特征值都是 正的. 设々是某个整数， R 考察 Hermite 矩阵 A - A *( A )/, 
它的第々个特征值是零.根据 Sylvester ■定理 （4. 5. 8>, S ( A - X k ( A ) I ) S - = SAS B - X k ( A ) SS ' 
的第々个特征值也是零. Weyl 不等式 (4.3.2) 说明， SAS *- A *( A>SS •的第々个特征值有如下 


的上、下界 

或 


H 


Xk(SAS- ) -f A,(~A*(A)SS- XA*(S.AS- -A,(A)SS' ) = 0 

<A,(SAS- ) +A„(-A*(A)SS , ), 


A*(SAS' )^-A,(~A*(A)SS- 
{X k (A)XASS a ), 


1 


A,(A)A,(SS' 


=A m (A*(A)SS* ) 
如果 A*(A) ^ 0, 
如果 A*(A> <0, 


A*(SAS- )>-A,,(-A t (A>.SS* ) - A.(A»(A)SS-) 


A,(/\)A,(SS-), 如果 A“A> 彡 0, 
\ k (A)XASS' ), 如果 A*(A> <0. 



阵和对称矩阵 


161 


在任何一种情形 [ A “.4>>0 或者 A *( A ><0] 下，这些不等式都推出 A *( SAS * )=0 山对适合 
Xi(SS' Xft < A „( SS - ) 的某个 A 成立. □ 

在 Ostrowki 定理中，如果/ \ = /6 M b ， 则所有 A *( A ) = 1 且么 = A *( SS * ). 如果是 
西矩阵，则>^(55'>=义/55’）= 1且所有乳=1;这表明在酉相似下特征值的不变性.因此， 

定理中给出的关于 A 的界对任一给定的 A 和任一给定的非奇异矩阵 S 是最合适的. 

通过简单的连续性论证， Ostrowski 定理可以推广到包括 S 是奇异矩阵的情形.在这种情 
形，设 e 〉0, 然后用 S + d 代替 S 来应用定理可知夂 （（S + eD ^ US + e/r )= ftA *(>\), 并且 
M ( S + d >( S + e />， XftgA.US + e/XS + HK ). 现在让 e -0 便得到界 O <0 t d ”（ SS ' ). |224] 

这个结果可以看作 Sylva ^ r 惯性定律到夺异•相合的推广. 

4. S . 11推论 设 /^. SGM ,, 且 A 是 Hermite 矩阵. 设 A 和 SS •的诸特征值按递坩顺序 
<4. 2.1) 排列. 那么对每个々 = 1，2，…，”， 存在非负实数 A 使得 A,(Sy )fl 

A *( SAS - ) = ftA *( A ). 

特別是 SAS •的正（负）特征值的个数小于或等于 A 的正（负）特征值的个数. 

求复对称矩阵在 7 相合下的诸等价类的标准代表元问题有一个更简便的 解法： 只要计算秩. 


4. 5.12 定理设 A , 打是（复或实）对称矩阵.那么，存在非奇异矩阵使得 A = 
SBS T ,当且仅当 A 和《冇相同的秩. 

证明： 如果 = 且 S 非奇异 • 则由 （0.4.6) 可知， A 与衫 有相同 的秩. 反过来，利 

用 （4. 4. 4>可导出 

A =U i S i U! = U { I(^)DiUr = (l/.D^/a.Xl/iD,) 7 , 

其中，/(2,) 是工 的惯性矩阵 （4. 5.7), 它由 A 的秩完全确定，是西矩阵， 

❿， … ， 久） M 所有 ct,S?0 ， D, =diag(c/ ， • 义， … ， A ) 且 

y / a , * 如果 a , 〉 0, 

d , = \ 

1. 如果 a , =0. 

注意，认是非奇异 矩阵. 也可以用同样的方式导出 13=([； 2 D 2 )/(2: Ml ； 2 D ? > r ， 且其中各矩阵 
有类似的定义.如果假定 rank A = nmk B ， 则 K 2,) = J (叉），且 

/(&> = ((7,D,) ^[(L/.D,) 7 ]- 1 = HI 2 ) = (L ； 2 D 2 ) ■ 机 （ l ； 2 D 2 ) r ] ' 

W 此 

.A = ( UiDJOADPKRDiML / W 1 J f . 

由此得出 A 与 iT 相合. 口 

练习在 i 相合下，复对称矩阵组成的集合中有多少不同的等价类？在实对称 
矩阵组成的集合中呢？ 

练习设/是对称 矩阵. 证明存在非夺异矩阵 . SeM „ 使得 A = SS r ， 当且仅当 A 是 
非奇异矩阵. 

练习设 A ， 是对称 矩阵. 证明存 ft 非奇异矩阵 X , YeM n m i 4 A = XBY , 也就 
是说， A 与 B 等价，当且仅当存 ft 非奇异矩阵 SeM ” 使得 A = SBS 7 , 即 r 相合. 提示： 
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如果 A 和的秩是什么关系？ 

上述结果相当于关于复矩阵相合的 SylveMer 惯性定律.下述结果相当于 Sylvester 定 
理的 Ostrowski 数量形式 [( 4 . 5 . 9 >和 （ 4 . 5 . 11 )]. 


4.5.13 定理设 A ， S € M”，RA = A r . 设 A =【72【厂和 SAS r = 是 A 和、 SAS r 的 

Takagi 分解 （4. 4. 4) ，其中【/ 和 V 是两 矩阵. 2 = diagU , ，心，…， a n ). M = diag (/ i , , , 

•••，〜>• 且所有 〜彡0. 设 A,(SV >表示 SS •的特 征值. 假定数 a ,， ", 和 A ,( SS * ) 都按递 
增顺序 （4.2. 丨）排列.则对每个々=1, 2, •••• «,存在适合>的非负实 
数 ft 使得如果 S 非奇异，则所有认〉 0. 

证明： 数 〆 是•的特征 ffi , 其中 /i = SVLS r . 因而 

fA = A〆 朋 • > = A*(SAS r .SAS* ) = A*(S[AS r SA]S* ) = 0,X k (AS T SA) 

对适合 A , ( SS _ )<^< A ,( SS - >的某个久成交；为得到最后一个等式，我们利用了 （4. 5. 11). 
W 为两个矩阵乘枳的特征值与乘枳 （1.3.20) 的顺 IT •无关，乂 W 为特？ iF . 位夂适 实数，所以还有 

/A = dtX^AS^A) =d k X k (SAAS r ) =0 k X k (SAAS -). 

洱应川 （4. 5. 11), 则对适合 )<^< A ,( SS - >的某个久有 

/4 = 0»0 k ^ t(AA ) — OkOtoi ， 

W 此，汐=/^^7*=心*, fcl A 三在所要求的上 " F 界之间. 口 

我们从 （1.3. 19 】 得知 • 两个可对角化的矩阵可经 M —个相似变换间时对角化，仅当它 
们可 交换. 关于通过相合 W 时对角化的相应结梁足什么呢？ 

或 i 1 tt ¥ 是由于研究关于稳定7衡的“般小振动”力学问题，才促使 人们去 芩虑关十通过相合 
[22"6] N 时对角化的有关结果.如果动力系统的绀态由广义 （ Ugnm R e ) 坐标％，的，…，％来确定，其 
中厣点 M 稳定平衡点，则4:顷点附近.势能闲数 Vn 了以通过川广义坐标</,表不的实二次喂 

V = 

来逼近.动能了可以通过用广义速度 (/, 較示&实一次 m 



来通近.系统的变化过程由 Lagnmge 力稈组 


d 
d / 

所决定，它是常系数二阶线件常傚分方程组，如果两个二次型丁和 v 是非对角的，这些方程就 
是耦合的 （ w 而要解这些方程焙较闲难的 >• 我们可以假定实矩阵[心]和是对称的. 
如果町以求得非奇异变换 S =[. v :; ] eM n ( if # SAS r 和 sbs 1 都是对角矩阵，则关于适合关系 


( f ) -爱 


j}V 


= 0 


1 (4. 5. 14) 

的新广义坐标/>,，动能二次型 T 和势能二次型 V 都是对角 矩阵. 在这种情形， U grange 方程 
组就是由"个分离的常系数二阶线性常微分方程组成的非耦 合组. 利用指数函数和三角函数不 
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难解出这些方程，而原问题的解可利用 （4. 5. 】4)求得. 

W 此，如果可以通过相合 N 时对角化两个实对称矩阵，则一类重要的力学问题的实质性简 
化足以实现的.根据物理知识，动能一.次型是正定的，结果证明，这是可通过相合间时对角 
化的充分（而不是必要的）条件. 

我们可能要考虑的同时对角化结果有多种形式.可能有两个 HermiR * 矩阵 A 和 B ， 并且可 
能希喏对某个西矩阵 L / 使 【 MU •和 U / U / •都是对角矩阵，或荇可能满足于较弱的结果，对某 
个北奇异矩阵 S 使 SAS •和 SRS •都是对角 矩阵. 类似地，如果 A 和 B 是对称矩阵，我们可能 
純 [ ML 〖7 和 VBV \ nJt SAS T 和都是对角 矩阵. 甚至可能会有这样的 M 合问题， A 是 
Hermite 矩阵，而 B 是对称矩阵，希窄 L 7 AL / •和 L/BLM ,或 SAS •和都是对角矩阵.在 
每种怡形，要考虑的自然相合是保持相应矩阵的特殊代数特征的相合.所舟这些情形都出现在 
应用之中.它们都可以用同样的技巧来处理， lW 要与 虑的锒 简单悄形是两个矩阵之中有一个是 
II :奇异的 情形. 4:表 4.5. 15 T 中列出广苦干结 *• 它对每种怡形都给出一系列等价的必要充 
分条件.将这些必要允分条件按指定觖序编号是 为了敁 示各种怡形中相平行的条件. 

4.5.15 定理设 A , 人是给定的.设 (7 表示两矩阵， S 衣示茆夺样矩阵， fiU , 

则冇表 4. 5. 1 ST . 


表 4 .S. 1 ST 


对 A 和 H 的假定 

i-/r 

=A 


已对角化矩砗偶 
u ) UAU r fUUH (- 


h ) SAS ' ftl SHS ' 


( a ) UAU ' 和" 《 U r 


h 非奇蟑矩 M : 


关于可同时对角化的等价的必要允分条件 

vTM 7 Wn ~ v ' (V 

(2> r 冇实特征俱月叫肉对角化 

(3) (.' tf ； I Icrmiic M 

(4) A «= HA •即 A 与 B 可交換 

存在非奇洋矩 W K 6 M . 使得只 ' CR 是实对角矩牌 
<2> C 有实特 ff 值且坷对角化 
(I >存在西阵 V 6 从使得 V . CV ft 对角矩 ft 
(2> r 是 《 r 两对角化矩奸 
(3>(是 II :嫌矩 ft 


1^ A 是 非奇拌 &阵， 

I 果方是 i ? 奇异 矩阵, 
C=B l A 


( b ). SA . S ' fll SHS 1 


( a ) UAU ' #U UliU T 


b ) SAS * «J SBS T 


(1> 存 ( V : 作命 异妒阡 KeM „ l CR 足刈 角妒阵 

(2> r 是可对角化矩 H ： 

(1>存在 內妒阵 使得 VV CW 是对炻轵阵 

(3> r 是对称矩味 

(4 M«=M 


(1) 存在非奇样矩阵 K 6 M . 使得 K —' CK 是对角矩阵 
(5>存在非奇异矩阵 RGM . 使得於是对称矩阵 


证明： 在六组条件的每一组中，所述大部分条件的等价性只是 W 于定义的推论. 
中（3> 和（‘ I )的等价性可以从以下论断 推出： 如果 A 和 B 是 Hermite 矩阵，则 A /3 是 
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矩阵当且仅当 A 与 S 可交换，以及 A 是 Hemiite 矩阵当且仅当是 Hermite 矩阵.类似地 
可证明 111( a )(3) 和 （4) 的等价性，这是因为， B 是对称矩阵当且仅当 1 是对称矩阵，还因为， 
如果 A 是 Herinite 矩阵，则/ \ r = A . 

在六组条件的每一组中，条件 （1) 的必要性可直接从相应的相合具有对角形式的假设推出. 

例如，在情形 fl ( b >, 如果 SAS T = A 和 SBfsM 都是对角矩阵，则 

A X B = ( S T A , S )[ S - , M ( S r )-'] = S r ( A - , M )( S T )-' , 

因而 /?= s T 将对角化0=八 1 3.类似地，在情形 I ( b > 和 in ( b >， 尺 = s •也将起对角化作用. 

如果 s 是西矩阵，则每种情形的相应矩阵尺也是酉矩阵. 

考虑情形 I ，其中 A 和 B 是 Hemihe 矩阵，且 A 是非奇异矩阵.假定 I ( b )( 1 ) 成立，即 

存在非奇异矩阵尺每个 r , eC ", 以及对角矩阵 AsdiagG ,， A 2 ，…， A .) , 

其中所有 A , 是实数，使得 因而 = 且尺 • = Ai ? 丄不失一般性， 
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-一 假定相重的 A , 项的值是排放在一起的，因而 A 有分块形式 


A , (T 

A , 

0 ••• 


山」 


(4. 5. 16) 


A, € ; 1 < w, < n | Ai = /i,l . 1==1 ， 2 , …上 


其中，所有〜是 实数， 且如果*»,则 ； i ,# 内. 如果所有 A , 项末必相等，选取适合】 
” 的任意/，）使》,关 A ,, 并且考察恒等式 = ARA 两边的,•， ； •项.这就是 

r ； Ar ,\, = r ； Br y = r ； Br , = r ； Ar 山 = r ； Ar , X ,, 


这里，用到 / A 和 8 是 Hermite 矩阵（因 而对 所有 y eC m ^ x m Ay = y ' /\* r ) 以及 A , 和 A , 是 
实数的 事实. 因为 A •关 A ,， 我们推出 rMr ,=0 W 而；这表明矩阵 
B 尺和尺 • A /? 都是分块对角矩阵， fl 与 （4.5. 16) 有相同的 形式； 即 


其中，对* = 1，2, 


R ' BR = 

0 


0 

= R.ARA 
B k _ 


k. 



0 



A ,^ M nr 这部分化简到对角形式，如果々= 


即如果所有 


都互不相同，它将完全化简成了对角 形式. 如果々<〜则某个子块有 „, >lf 且因 
为 A , 和艮是 Hermite 矩阵，可以利用谱定理 （4. 1. 5>导出 =[；•£),(；,• ,其中17,, D , 6 M n , 

f 

U •是西矩阵，而 D •是实对角矩阵，则也可对 角化. 如果令 
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U 


V、 0 ■ 

1 

「 D, 0" 

u 2 

0 ••• , 

i ， D = 

d 2 

0 '• 

. U k \ 


/)*• 


且当川=1时 U , = [ l ]， 则 U 是西矩阵， D 是实对角矩阵，且 


R' BR = U(.DA)V , R' .AR = UDU\ 



最后，欲求的表示式是 

A = [(/? ')- L /] D [( i ? *)-以].和 B =[(尺 l ). C /]( DA)[(R yt ；]、 

注意，如果假定 l ( a )(1) 成立，证法是相同的，只是我们还知道 K 是0 矩阵. 在这种情形， 
(K 是两矩阵 fll ( a >(】） 的充分性得证. 

余下的四种情形中所要作的证明是类 似的. 利用相应的假设得到相合矩阵，它们是分块对 
角矩阵，然后利用关于 Hermite 矩阵 的谱定 理或关于对称矩阵的 Takagi 分解 （4. 4. 4) 便完成了 
到对角形式的化简. 

考虑悄形 H , 其中， A 和 H 是对称 矩阵. 且 A 是非奇异 矩阵. 假定 D ( b )(1) 成立，即存 
在非奇异矩阵 / e - CnrvrJeM ,, 每个 necr , 以及（不一定是 实的） 对角矩阵 A = dia g ( A , ， 
&,•••， AJ , 使得 K 1 A l BR = A t 因而 = 且尺 T ft /?= R T ARA . 又假定相1的项是 

排放在一起的， 因而 A 有形式（4.5.16〉，且所有&互不相同.如果不是所有 A , 都相等，选取 
适合1</，的任意“ •使 A •关 A ,， 并考察恒等式 R T B /?= i ? T A 尺 A 两边的 :•，） 元.这就是 

rjArjXj = r .' Br , = rjBr ^ = r ; T Ar , A , = rjAr , X , 

这串，用到了 A 和 B 的对称性（对所有 I ， v 6 C \ x 7 A ^ = /^). 推出 

midi rlAr ^ rjHr ^ rlBr - O . 这表明矩阵和尺 T A 尺都是分块对角矩阵且与 （4. 5. 16>有 

相同的形式：即 


I 

R T BR = 

0 


B 2 


0 


O ' 

= r t ara 

B k _ 

0 ' 

t 

ftkA k ^ 


其中 S ,， A , eM „ ( . 如果々=„，这就是所要求的 化简. 如果务 < w ， 则某个子块有 且认 = 
", A ,. 因为 A , 和艮都 是对称 矩阵. 可以利用丁 3 1^0分解（4.4.4)导出>\,=17 1 2,1；/\其中, 
u .， KM '， R 是西矩阵，而 Z 是具有非负对角元的对角 矩阵. 于是 


UJ . 如果令 
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aq = i 时则 卩是酉 矩阵， 2 是 （具 有非负对角 元的） 对角矩阵，且 


R T BR = V ( l /\) U r 和 = V 2 V \ 

最后，欲求的表示式是 

A = [(R ' ) r L /]2 [(R 1 ) T UY 和 B = 1 ) r l 7]2 A[(R 1 ) T L /] T . 

如采假定 D ( a )( l ) 成立，则 K 是西矩阵 fK / ryTL / sKL ； 是两矩阵，因此 IHa > U ) 的充分性也 
得到了证明. 

在情形 U 1, 证明需作一点 修改. 设 A , B 6 M ., 旦义是非奇异的 Hermite 矩阵， B 是对称 
矩阵.假定 lll ( b >( l ) 成必，即#在非奇异矩阵 K = 和对角矩阵 A ^ diaga , 

幻，…， D 使得尺 l /\ l BR = A . ferfu BR=ARA R - BR = R T HR = R - ARA . 现在假定模相 
同的 A , 项排放 A : —起使 A 有形式 



并 R 对 j , ^1, 2•…，》,冇 I ，， I = I ，， I ,而如果则 1 /，、 I 关 I # I • 如果 
不是所行 A •项有相同的模，则选取适合和 U •丨爹 U , | 的任意 I , j , 然后 考察惊 
等式尺 WR =/ rA /? A 两边的 ^ /元.这就是 
阴 2] r.Mr,A ; = rjBr, = rjB'r, =* r ； Ar,X, - 

这里，用到了 AfiHermite 矩阵及 B 是对称矩阵的事实.于是| r ； Ar , \ U , | =丨 r ； Ar t | 
U , I ，乂因为 I A , I 关 UJ ，由此推出 r ； Ar f =-0, 因而 r / A r ,=^ Br ' = r 7^,=0. 这表明 
矩阵及和 /T A 只都是分块对角矩阵且与 （4. 5. 16) 有相同的形式，即 

0 

-… b 2 

R r BR= = R-ARA, 

0 '• 

- B t _ 
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L a * a*J 

其中， 所有 B,，A,，A,eM n , a A ,=(7, Df , 

I 

Dj = diag ( e »' #, »， 〆 ），••• , e \ , ), 


所有心如果々 = /;，这就是所要求的化简.如果 々< Oi ， 耶么某个子块有 w ,> l 且认= 
A . A ^ oA . Dl 因为是两对角矩阵，所以 D ,_ = D , = D, F = D , 、因而 

O/B.D, =a,D ： A,D,. (4.5. 17) 

这个 W 等式左边是对称矩阵 7 ^ 13 , 1 ), , 而右边是 Hermite 轵阵 WA , D ,, 且所有 a . 是实数. 

如果推出 DM . D , 是 Hermite 矩阵，乂足对称矩阵.而一个 Hermite 矩阵只有在它是 
实矩阵时才能是对称矩阵.因而，如果久关0, CVA , D , 就是实对称矩阵.如果 a ,=0( 至多对 f 
的.个值可能出现这种怡形 >• 则 rVA . D , 是 Hcrmite 矩阵，但不一定是实矩阵.根据进定理， 

对每个/=1，…，々存在内矩阵 （7.6 R 以及实对角矩阵 M ., 使得如果 
1^0,则 C 7, 可以选为实正交矩阵，这时 = il 

DJB.D, = a.D ： A,D, = U,(o,M,)U!. 

如果 CT ,=0, 则 【/,• 可能不成立， 但足， ㈥ 为两边都是零 • 所给出的等式仍然正确.因此， 

对所有/=1，2,…，♦，有 

人= ( D , LOH ( D , L / 〆 和战= ( UU . Xa . M . XD . l ；,) 7 . 

如果令 _ 



则3=[(只 1 厂1/]2“[(； 7 只- 1 ]|1 a = [(尺 ')- f ；] M [ rrR ], 这正是所要证 明的. 如果假定 in 
( aKI > 成立，则尺是两矩阵，因而（尺和 （/ T ^ TL/s 尺 (7 是酉矩阵， w 此 m ( a )( l > 
的允分性得证. 

， a 是非奇异矩阵时，这就完成了 m 的 证明. 如果 b 是非奇异矩阵， m ( b >( i ) 的假定说 
明，存在非奇异矩阵尺 eiW , 使得尺 \4^= A 是对角矩阵，因而 = 且友 • AR = 
KWKA . 此后的证明形式上与 A 是非奇异矩阵的情形相同.在证明中仅仅交换 A 和 B 的地 



位，且用 Takagi 分解（4.4.4>对龟化而不是用谱 定理. □ 

在定理 （4.5. 15)( 表 4.5. 15 T ) 的情形丨和 II ,有一个关于 .4 的熟知的条件，它等价于 
A 和 H 可通过相应的相合同时对 角化. 这就是 A 可对角化（或许 其特征 值都是实的），即 

A 具有形式具中 A S 对 ft 矩阵（或许 A 是实矩阵）.原则上，这个条件可以通过验 

wH.A 43的极小多项式是否有不 H 的线性（或许是实的）因式来检验. 但是在 情形 D 1, 所述条件是 
不多阽的.即 A 具有形式亿仏\其中对 ft 矩阵. 这个条件说明 . V 1 /^ 可通过合相似而 

不是通常的相似对角化.关十合相 fti 性的讨沦见 （ 4.6> 节.定理 （4.6. m 证明，条件 （4.5. 15 III 
( b )( m 等价于 条件： cr 的特征值均为非负实数， rf : 可对 角化 . n rank C=rank CC . 

在定理 （4.5. 15>屮 作非奇异性假定是方 便的. fli 是在两相合的情形丨 （ a) , || ( a > 和 Ul ( a ) 
中，这个 假定坷 以取 消.在情形 这种计筲方法给出 rX ： 于可交换的 Hermite 矩阵可同 
[234! 时西对角化的经典结果（七 1.6) 的乂一个证明. 

4.5.18 推论设 .4, 

( a > 如果 A 和 B 都足 Hcrmite 矩阵 • 则存在 两矩阵 t ； e 吣使得•和 LW ； •都是对角 
矩阵 • 当且仅当 .4 B 是 Hermite 矩阵 * 即仙 = B /\. 

< b ) 如果 A 和 B 都 S 对称矩阵，则存? V 两矩阵 使得 L 7 AL 7 r 和 L / Bt ； r 都是对角矩 
阵.当且仅当 ABM 正规矩 阵； \ iVABBA ^ HAAB . 

( c ) 如果 A 是 Hermite 矩阵•而 H 是对称矩 阵. 则存在 ft 矩阵 U e M „ ,使得 【 ML /. 和 
都是对角矩阵 • 当且仅当对称 W 阵： 

证明： （ a ) 如裝 [MW =△ 和[川【厂 都坫对 角轵阵，则泌={厂/\1；, B = VMU , W 
而 AB = U'MRJ' MU=U' AMV^V MaV^W MUU' AU= BA. 反过来，如果 AB = BA, 
则对某个 f > 0 . A t —A-\€l 足非 夺样 Hermite 斯阵. H . A,H - B — AB — BA-^-eB 

= B (. A + € /) = BA r . 因此，与 A , 和 A , 1 可交换, W 而 A W 是 Hermite 矩阵根据 （4.5. 15> 
(表 4. 5. 15 T ) 的 r ( a )(3). 存在西矩阵 U ,. {m V t A,V ； ^U,AU ； + e /= A , » U t BU ； •都 
是对角矩阵，因而 U,AU ； = M •— c / fn U t BU ； = M C 都是对角矩阵. 

( b ) 5 n 果 CM 【厂和 UBC； r = M 都是对角矩阵，则 A =【/， aD , B = W MU , 且 = 
【/•/ U / [产 可西对 角化. 因而是正规 矩阵. 关于逆命题，假定/是正规矩阵 
fl A 是非奇异矩阵，则 .4/^ M 1 ) 正规矩阵， rfii (4. 5. 15) 的 II ( a )(3) 说明，两个对角 

矩阵 A 1 和 B 是同时可两对角 化的. 因此，存在两矩阵 U €： A ^ 和对角矩阵 a , MeM ", 使得 
A 于是/ \ = [；a : D 7 ■和 B = 这正是所要求的/\和 B 同时对 

角化形式.如果/\是奇异矩阵，则根据 （ 4.4.4>，存在西矩阵使得 LM [7 T * 对角矩 
阵，如果 必要， 还可以交换1/的诸列使得 

umj t = [^ V 2 e R ，1 < 々 < „， 

且2是非奇异对称矩阵（实际上是对角矩阵 >• 如果把 C / BLT 写成相应的分块形式 

TTurrr r ^ 11 私2 "I 

UBU = LB r 队 」 • B n 6 M, , B :z e M a k , 
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则子块/、和 B 22 是对称矩阵，旦有 

_ rr 

( UAU T )( UBU l ) = UABU ' = 一 



0 - 


但是 【 M / U / •还是正规 矩阵. 因而 2 B I2 = 0( 见本节末习题 20), 乂因为2是非奇异矩阵，所以 


B . ? =0. 这说明 
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aJAU^dJBU 7 ) = 


'inn 
• o 


O ' 

0- 


根据上述关于非奇异悄形的证明，得知 • < r : n 內矩阵和对角矩阵山， A 2 eM t9 使得 
fflB „- V , A 2 Vr . 因为於对称矩阵,我们还知道,存在两矩阵 V 2 eM ,,- 4 和对 
角矩阵 A :< eiWd , 使得 B 22 =\， 2 山 ' …如兵设 A = A • ㊉ OeM ,, M = A 2 ㊉ 山，且 V = ㊉ V ” 

则有 IML/ T = VV \ V T . UBU T = VMV . 因此, A = VMOT VO r 和 B = OT V ) M(LT V> r 
是所冇要求的 M 时对角化形忒 . 


( c ) 如果和 【《 C； 邻是对；? :坧 吟，则 y \- 定是实矩阵.有/\ = [；.41；, 

以及 


AB= V AUU' MU = UWMU = L/* M\D 
=V MUU t AU = (U- MUHLFaU) = BA. 

反之，如果 = 则对某个 e > 0 , .4, EA + e / 是非奇异的 Hermite 矩阵，且 A,B = 
AH - heH^fiA i e H = BA ,. 因此， （4. 5. 15> 的条件 m ( a )(1) 披满足 • R . 疗在丙矩阵【人 € 使 
得 U , A t U ； ^ U , AV ； +H = /\ •和 U , BU !-= M , 都是对角矩阵， W 而 U t AU ； =么一 e / 和 U . BU ! 

都是对角矩阵. 口 

两个奇异 Hermite 矩阵经（不一定是 西的） •相合㈣ 时对角化的问题在习题8中讨论. 

我们已经看到， ft ••相合下，一个 Hermite 矩阵总坷以取非常简单的形式（在对角线上有 
土 1或0的对角矩 阵）， 并 fl , 在一定的条件下，一对 Hermite 矩阵经.相合 SJ 以同时变成对角 
矩阵. 于是， A 然要提出的问 越是： 一般的 Hermiie 矩阵偶.4，在同时•相合下可以变 
成什么样的标准形？即经 C 一次相合，矩阵偶 

CT AC 和 C • B (: 

可以取什么样的标准形？虽然这个问题是针对 （ 可能都是奇 异的） 一般 Hermite 矩阵偶来讨论 
的，但是不论是提出还是证明其一般结果都是相当复杂的.这里，对其中至少有一个矩阵是非_ 
奇异的 Hermite 矩 阵偶， 不加证明地叙述标准形偶 定理. 我们已经 i 寸论了可经•相合同时对角 
化的特殊情形. 


4. S .19 定理假定 A ， Be 是 Hermite 矩阵，且 A 是非奇异 矩阵. 则存在正整数々和非奇 
异矩阵使得 
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C* AC = 


其中，每对 A,, B,^M n , i = l, 2, 


B ,= 


且 a 是实数，或 


A, 0' 



0' 




c= ^ 

0 ••• 

t 

^ LJ 

0 ••• 






k, 是两种可能形式 之一： 


B ,= 


"0 

Q 

1 

"0 

1 

• 

參 

參 

a 1 

• 1 

• 

• 

參 

0 

• A, = e ... 

1 

0 


0 

a 


0 


••• 1 



9 

• 

參 

a 1 

• 

• 

• 

0 

. ， A, = 

"0 

a 



• •• 】 

參 

• 

• 

0 


1 

0 





(4. 5. 20) 


(4.5.21) 


Ra 是笈数 . 在 （ 4.5.20) 中 e 是十 1 或 • 1, 而在 （ 4. 5. 21 ) 中是偶数 II 两个非零子块都在 
Mu/2)' 中 . 

说明： 

1• 在《是实数的悄形，可能有 = 于是两个子 块貝有 形式土〜土 1 . 相戍于同一个 

值（例如还相应于同一个值 £= 】 } 的多个 1 X 丨子块，在（ : • 仪：中将产生形如的子块， 而在 
C'AC 中则是 /. 

2. 在 a 是复数的情形，可能％ = 2 ,于是两个子块具有形式 


>「 0 1 , W 0 】 1 . 

La 0J Ll 0J 


3 . 在定理中，同时产生的子块结构恰好对应于 .4 」的 Jordan 标准形.即的诸基本 
Jordan 块恰好是注意到 （f AC) 1 ((：• U =C 1 (A … B>C, 因而 C 也是使取 
Jordan 标准形的相似 矩阵 . 于是定理所确认的形式玎以从 /\ 2 B 的 Jordan 标准形求得（确定诸 
惯性因子 e 是不难的 ）. 


4. 5. 22 注释就像两个 Hermite 矩阵 A ， 在 • 相合下的标准形偶 （ 4. 5. 19 ) 类似于 A. 丨 i3 的 
Jordan 标准形一样，关于两个实对称矩阵 .4 ， 13, 在实 7 相合下也存在一个标准形偶，它类似 
于 A j 的实 Jordan 标准形 . 其中，形如 （ 4. 5. 21 > 的子块 13, 用形如 （ 3. 4. 4 ) 的类似子块来代 
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替*而其他可能形式的子块取原来的形式. 

习题 

1. 设 A ， 且假定 B 是非奇异矩阵.证明存在使得 A = BC . 此外，对任一 
非奇异矩阵有 SAS _ =( sas * ) C '， 其中 C ' 相似于 c . 

2. Sylvester 惯性定律 （4. 5. 8) 的证明中较难理解的部分是要证明，若 D , 和 D 2 是相合的 
«父”惯性矩阵（4.5.7)，则它们有相同个数的正对 角兀. 正文中给出的证明依赖于 Counmt - 
Fischer 定理的 推论. 清对下述初等证明作洋细的论述.假定并且假定 D , 恰好 
存 s 个正对角元且至少有一个负对 角元. 假定的前 s 个对角元和 D 2 的前/个对角元是正的， 

其中 K . v ， t < n . 如果 s </, 证明存在一个非零向世 j = U ] ecr 使得〜 丨=〜 2 =—=及=0及 
( Sr >, =( Sr 〉 2 =—= (&•>， =0. 然后证明，而 ( SrrZ ^ SiXO 从而得出矛盾. 

3. 设 A , B 6 M n 都是 Hermite 矩阵.证明下列四个条件 等价： （ a > A 和可经•相合同时 _ 
对 角化. （ b > 对某两个非零实纯 M 心 6, “A + 6 B 与 B 可经•相合同时对角化. （ c ) A 和时 

•相合于一对可交换的 矩阵. （ d ) A 十 iiT 相合于正规矩阵. 

4. 试 用定理 （4. 5. 15) 证明中的证明方法以及交换族定理 （1.3. 19) 和 （4. 1.6) 证明定理 
(4.5. 15) 之丨 （ b ) 的如下 推广. 设 A ,， A 2 ，…， ASM , 是绐定的 Hermite 矩阵，其 中九是 
菲奇异的，则存在一个非夺异矩阵丁6 使得对 所有， =1, 2 ,…，I 了•八: T 是对角矩阵， 

当且仅当 （《> 对所有/二2,…，々，八厂八相似于实对角矩阵， H ( b ){ Ar , A f ： i = 2, rz } 是 
一个矩阵交 换族. 提示：设（：,=.4, a 对于所冇/ = 2,…， SC.S 1 是实对角矩阵.设 
B , = ( S - ) '. A,S l . 然后 证明彳 / U - 个 HermUe 矩阵交换族.存仵一个西矩阵 I ；使得对所有, • 

= 2 ,…， K L ； fU 7 •是对角矩阵，而 r = L / S 是所要求的相合 矩阵. 相应于 （4. 5. 15) 之 U ( b ) 

的推广足什么？ 

5. 由 （4. 0.4) 给出的具有实对称系数矩阵八(0*)=[〜（1)]的微分算子£在点16^)匚1^是 
椭圓型的，是指其系数矩阵 AG ) 是非奇异的11它的所有特征值有相冏的符号.称 是双 
曲型的，是指 A ( t > 钴非夺异矩阵，且它的《— 1个特征值有相同的符号，而一个特征值有相反 
的符弓.试说明， 力什么 关于一个坐标系一个微分算子在一个点是椭岡型（或双曲坳），则关于 
其他每个坐标系，这个微分算子在那个点也是拥 _«!( 或双曲型）. Laplace 方程 

▽ :/= "0 + |^ + "0 = 。 

给出 r 椭圆微分算+的一个例子，而波动方稈 



珐双曲型算子的一个 例子. 这两个方程都是在笛卡儿坐标系中给出的.在球极坐标，柱面坐标 
或其他坐标系下，这两个方程的差別就很大. 

6. sx =[ x , ，…， X „] r 和 y =[ y ,， …， v \] r 是由具有有限二阶矩的实随机变量组成的 
两个向 M . 事实上（见第7 章）， x 和 Y 的协方差矩阵都只有非负特征值.假定其中至少一个协 
方差矩阵是非奇异的.证明存在实非奇异矩阵 S 6 M n ， 使得 sx 和 sy 的协方差矩阵都是对角 
矩阵.用统计学术语表述是，可以求得一个非奇异线性变换 S 使 SX 和 Sy 的诸分最各不 [239 



相关. 

7. 利用习题4给出三个或多个随机向 M 满足什么条件就能保证有一个非奇异线性变换使 
变换后的诸随机向擞的各分量是不相关的. 

8. 定理 (4. 5. 15>的情形 I ( b ) 考虑了两个 Hermite 矩阵在至少有一个矩阵是非奇异的情形 
下经合同时对角化的问题.推论 （4. 5. 18 a > 考虑了两个矩阵可能都是奇异的情形下用酉•相 
合同时对角化的 问题. 若两个矩阵都是奇异的，则经（不一定是两的）•相合同时对角化它们的 
问题最终可化成 （4.5. 15>,似必须考察这两个矩阵的两个零空间之交的正交补的性质.设 A ， 

是 Hermite 矩阵， W 假定它们都是奇 异的. 设 A /( A ) 和 A /( B ) 分別表示 A 和 B 的零空 

间 • U ) 考察^ U 和 L g 可以证明，存在一对奇异 Hermite 矩阵可经•相合同时对角化. 

( M 假定 mA ) n / v ( B ) = m . 证明. 若 A 和 B 可经•相合同时对角化，则存在一个实数“使得 
以十朽 是非奇 异的. 提示：若 CeM ” 是非夺异的， （’•4(；= 山 ， a C * BC = A 2 , 其中丄和山 
是对角矩阵，证明 A , 和山的零主对角元不会处在相同位 S . 你能选取“使得 《 A ,+ A 2 的主对 
角元都不为芩吗？ （ c ) 利用 （ b ) 证明 

0 1 0] 「0 0 0- 

A = \ 0 0 和 衫=001 

.0 0 oj 0 1 0. 

不能经•相合同时对角化. （ d ) 若 

N ( A ) fl N ( B ) = <01, 

乂 不为芩且 “A + f 3 是作奇异的，利用习牲 3( b >, A 和 B 可经•相合同时对角化当且仅当 

+ 可对角化且只有实特征值. ( e ) 若 dimN ( A > nN ( B >= ife > l , 设 U , •心，…，… } 

是 R ” 的一个标准正 交基， 而其中的<“,，“：••••，是 / V (.4> n / V ( m 的一个标准 正交基 •若 
，…， ] 6 , 证明 

U - AU ^ P U'BU -= r°4 -?l, 

Lo : a '」 Lo : W 」 

其中 A '， B f eM H . k9 N ( A / > n / V ( B / ) = { 0K 而左上角的零子块是々 X 々的. 证明， A 和 B 可 
经•相合同时对角化当且仅当，和 Y 可经•相合同时对 角化. 虽然，和 ZT 可能都是奇异的，但 
它们的零空间之交足平 凡的. 试收集从（?0到（ 6 )的信息来叙述并证明关于两个 Hermite 矩 
阵经•相合同时对角化的一般定理. 

9. 如果 A ， H 6 M W . fi B 廿:奇异，证明 A 与 B 可交换，当且仅当 .4 与 B 1 可交换. 

10 •证明 j U 和 一 ^ 可经两 f 相合同 时化简成对角形式，但不能经.相合同时化简成 

对角 形式. 试用 U .5.15) 情形 n ( b ) 证明中所采用的构造法实现化简’且顺便求出实施这个化 
简的酉^0合矩阵. 

u .证明 [:: K ^不能经 * 相合或 r 相合同时化简成对角形式. 
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12. 设 A , HeM „. 且 .4 非奇异.证明 • 下列条件中的每一个，是 A 和 B 在定理 （4. 5. 15) 
4. 5. 15T) 所指每种情形的假设下经相应意义下的相合同时对角化的必要充分条件. 


情形 必要圮分条件 

TT7) 存在 Hcrmiic F 6 M . 使得 a = 

I (»» 存在 A 有实特征 值的蚵 吋角 化矩阵 F € M , 使得 《 = A /' 

U ( a ) 存在正 规矩阡 F 6 M . 使得 H = 

II < b ) 存在岈对角化矩阵 F 6 M . 使得 B = 

ID ( a ) 存在对 称矩疥 Fe M . 使得 = 

111( b ) 存在可合对角化矩阵 F 6 M . 使得 B = /\ F [见 （4.6. JO ] 


13. 设 A , ii € M . 是对称矩阵（可能都锆奇异矩 阵）， H 假定存在两矩阵 L 76 M 使得 

和 L 7« LT 二 M 都是对角 矩阵. 坫明存在丙轵阵 V 使得 提示： 如果 A = |24 l 
diag ( A ,, A ? . 夂）， 证明存在两对角矩阵 D 使得 ; i = D / l = ja 然后证明 

M = IT MAU = V ADilXMlJ = AO ； t D , D : D ) B , 

其中 D , 和 D 2 是酉对角矩阵. 

14. 利 用习题 13的必要条件证明， 刁题 8( c > 的两个对称矩阵不能经再厂相合同时对角化. 

提示： 计 W 和.4【/«的第一列.利用 （4.5. 18 b > 证明同样的结沦更容易. 

15. 如梁 A , 是对称矩阵 • 证明，只要 A 和打都是 非奇异 轵阵，习题13中经 7 相合 

M 时对角化的必要条件也是介:分 条件.提示： 411* BA = AUB , H . A 和 B 是非奇异矩阵，则 
^ 'BAB ] =U R 1 =UV . 这便推出 AZi'.A = ii 1 AAB *. 两边取逆推出 A A 是正规 
矩阵. 

16. 设/\， BeM ， 进对称矩阵 （ 叫能都足奇异矩阵>.并 R 假定存在一个丙矩阵使 
得 【 MC/ r = A 和 L 7 BL/ f = M 都足对角矩阵.证明可交换.通过考察习题 8( c ) 中的两 
个矩阵说明 • 经 PT 相合同时对角化的上述必要条 付不诂 充分 条件. 用推论 （4. 4. 5) 证明，这个 
必萝条分条件 • 只要 AA 和 /3 S 都有 w t 不问的特 征值. 

17. A , - A 是 Hemiite 矩阵， 《 是对称矩阵 • 乂假定存在两矩阵 [；€ iVt 使得 

C/ACT = A 和〃邰是对角 矩阵.证明 A 与可交换.通过考察习题1】中的两个矩 
阵说明这仑可经（•和0相合同时对角化的必要条件不是允分 条件. 试用推沦（4.1.5〉证明，只 
要的所有特 Kffi 疗不相同，则这个必要条件也是充分条件. 

18. 设 A ，86 M , 且 A 和是对称矩阵，.\还是作奇异矩阵.证明.如果广义特征多项 
式三 deU/.A ft ) 冇 wt 不同的 零点. 明 J .4 和 B 可经 7 ■相合间时对角化. 提示 ： A 1 f 3 的 
诸特征值是什么？ 

19 - 对％ lvester 惯性定律(4.5.8>的下述另一个证明作详细的论述.若是一个非奇 
异 Hermhe 矩阵 • M . S ’€ 是电奇异矩陴 .& S Q 尺娃一个分解 • 其中是两矩阵， 

而尺珐一个具佴正主对 ft 元的上：•:角矩阵 （阽 2.6. 1). 证明. 荇则 . S (/) = / Q + 

( 1 一是非奇异 矩阵 . a A (/) —. S (/) AS (/)' , .4 ( 0> 和 A ( l > 是什么矩阵？因为 A (/) 是非奇 [242 
异矩阵，由0变到1时, A (/> E ： 连续地变化.证明 .4(0) 与.4(1〉有相问个数的正（负）特 
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征值.对较小的 e >0 考察 A ± e /, 并论述一般的情形. 

20. 如果且 BeM *， 证明 .4 是正规矩阵，当且仅当 B 是正规 

矩阵 aC =0. 提示： 计算 AA •和 A ‘ A ， 如果 C * C =0, 则对于所有 • reC 1 ' ( Cr )* ( Cr )=0, 
因而对所有 ^6(：” ' Cr = 0. 

21. 说明 U . 5. 18)( b > 中所采用的证法也可以用来证明 U ) 和 （ c ) 这两 部分. 

22. 设歹 ={ A,， …， A *} 匚是给定的复对称矩阵族，又设泠 ={ A , A , : ) = 1, 2,…， 
k ). 如果存在一个两矩阵使得对所有的,=1,…，々， UA , L / r 是对角矩阵，证明//是 
一个交 换族. 当々= 2时这简化成什么结论 • 且与 （4. 5. 18 b ) 有什么关系？氕实上，4的交换性 
也足以确保分经西’相合可间时对 角化； 请参 ft 本饩末的“进一步阅读"中所引用的 Hong 和 
Horn 的文章. 

23. 设歹 = M ,， …，是给定的复对称矩阵族， yf ={ B l9 / UCR 是给定的 

Hermite 矩阵族，又设泠= <八只，：，•，>=1, k \. 如果存在一个两矩阵 （7 6 使得每个 

imw 7 和每个是对角矩阵.证明為和 y 邡是交换族， 且 /. f 于所有/ = 1,…，々和所有 
) = 1，•••，，《，认 A , 挞对称矩阵.当 々 = w = l 时，这简化成什么结论， R 与 U . 5. 18 c ) 冇什么 
关系？负实上，这些条件也足以确保多和义分別经扣合同时对角化.请参宥本节末的“进一步 
阅读”中所引用的 Hong 和 Horn 的文章. 

进一步阅读定理 <4. 5. 9) 的 Ostrowski 的证明以及有关的结果可参 S“ A Quantitative 
Formulation of Sylvester s Law of Inertia , ** Proc. Nat. Acad. Sci. 45 ( 1959) , 740-744 . 定理 
(4. 5. 25) 的另一种形式在 [GLR ! 中 给出； 包括两个矩阵是奇 ) f » ••阵 的情形的一个详细证明 

还在 K. C Thompson 未发表的手稿中 . 有关两个.以上矩阵同时对角化的结果可参看 
Y. 1》. Hong and R. A. iiorn• “On Simultaneous Reduction of Families of Matrices !o Triangular 
or Diagonal Form by Unitary Congruence/ 9 Linear and Multilinear Algebra 17(1985), 
画 271-288. 

4.6 合相似和合对角化 

提出本节论題的动机来源于前两竹的三个结果.定理 （4. 4. 3〉刻化 f 所有形如 UAU 1 的矩 
阵•其中，4是上二•角矩阵而【/是酉矩阵：为了现在的 R 的，需要把这个分解写成 【 MU T = 
U ^ lJ '• 推论（4.4.4)刻划了所冇形如【这以7 = ^{ 7 - 1 的矩阵，其中 2 是对角矩阵，而定理 
(4.5. 15) 的情形01则要求下述 知识： 何 时一个给定的复方阵 A 可经变换 A-SAS 1 化简成对角 
形式，其中 S 为某个非奇异方阵. 

4.6.1 定义设矩阵 A ， B 6 M ,, 如果存在非奇异矩阵使得、就称/\和 B 
合相似 （Consimilar ). 如果矩阵 S 可以取酉矩阵，则称 A 和 B 酉合相似. 

如果 A = 且 S = L / 是两矩阵，则加果 S = Q 是复正交矩阵， 

则/ \ = SBS kQSCr ; 如果 S =/? 是非奇异实 矩阵. 则 A = S /^ '^RBR 因此，合相似 
的各种特殊情形包括1相合.•相合和普通的 相似. 
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像普通相似一样，合相似是紙上的等价关系 • 因而我们可能要问，哪些等价类包含三角 
代表元或对角代表元. 

4.6.2 定义设矩阵如果存在非奇异矩阵使得 S ^ AS 是上三角矩阵，则称 A 
可合三角化 I 如果可选取 S 使得 .S l AS 是对角矩阵，就称 A 可合对 角化； 称 A 可酉合三角化 
或可西合对角化，是指 A 可以通过西矩阵的合相似化简成所要求的形式. 

如果 /\6 M „ 可合- 角化，并且 S = d 是上三角矩阵，则由直 接计算 可知， 

•S 的诸主对角元都是非负的. W 而， AA 的所有特征值都是非负的. 另一方 面，定理 

(4. 4. 3) 说明，存在两矩阵 U 使得 = 1 是上三角 矩阵. W 此，确定某个矩阵是否可 

经合相似化简成上三角矩阵的问题 Q 经解决丫. 

4.6.3 定理设是给定的矩阵.则下列命题 等价： 

( a ) A 可合三 角化； 

( l ») A 可合〒角化： 

( c ) AA 的所有特征值都是非负实数. 

如果 A 6 M ,, 是可丙合对角化的，则对 K •个丙轵阵【^从和 A = diag ( A ,, …， A „), A = 
UAU l = UAU T . 于 ; m = ( CM (7 r ) r =【 M r 【/ 7 = UU/ r = 1 WlWA 楚对称矩阵 . 推论 
(4.‘1.4) 说明，逆命题也成立 • fl 对 龟矩阵 总可以取非 负的. 因此，我们乂解决了西合对角化 
的问埋. 

4. 6 .4定理矩阵 A 6 M ,, 可两合对角化 • 当 ft 仅丐/\足对称 矩阵. 

其余与合三角化和合对角化舟关的问速是冇效地刻划那些可经一个不一定是两的合相似的 
可合对角化矩阵. 

如果 可合吋角化 fl S l .4 S = A = dia K ( A ,, 夂），贝如果 「.、•, 一•、•/)， 

其中每个 '6 C ”， 这个恒等式说明 As = A 入对 / = 1 •…，》 成立. 这个方程类似于通常的特征 
向 M — 特征值方程 • 但乂与它有本质的差別. 

4.6.5 定义设是给定的 矩阵. 如果对某个 A 6 C , 非零向 M * r 6 C ” 适合 ASU , 就 
称了为 A 的合特征 向量； 纯 MASA 的合特征值. 

W 等式 = 表明， S 的每个非零列是 A 的合特征向铖.因为 S 的诸列 无关当且仅当 S 
非奇异，所以得知，矩阵/可合对 角化. 丐 ft 仅当它有 w 个无关的合特征向 M . 从这个 
意义上讲，合对角化理论完全类似于择通的对角化理论. 

但是， 每个矩阵罕少介一个特征值 • tl 它只有有限多个不 N 的特征值；从这方面考虑，合 
特征值理论则大不相同.如果 A ? = Aj *, 則 f )( 〆 •!•）对所有托 

R 成立. 因此，如果/ I 是 A 的合特征偯，则对所有 0 eR ， 亦是 A 的合特 征值.另〜 ■方而， 

如果 则 U | 2 * r ， 因而，只有当 U | 2 是 AA 

的特征值时，这个纯才可能是 A 的合特征值.例如 A = G : 1 ]适合 AA = —2/， rfri/VA 
没有非负特征值，这个例 f 说明，有些矩阵根本没有合特征值.但是，已经知进，如果 





_ 且《是 奇数，则 A 至少必有一个合特征 值. 这个结果类似于每个奇数阶实矩阵至少有一个实 
特征值的事实. 

因此，与苜通的特征值理论相反，一个矩阵可以有无限多个不同的合特征值，或者它可能 
根本没有合特征值.如果一个矩阵有合特征值，有时为了方便，从模相同的合特征值中选出唯 
一的非负特征值作为代表. 

刚才得到的关于合特征值存在的必要条件也是充分条件. 

4.6.6 命题设且 A >0 是给定的，则 A 是 AA 的特征值，当&仅当 + VI 是 A 的合特征值. 

证明： 如果 A >0, A >0, 且对某个 j .^0 有 • 则 

vXAr = VAv 5 "-r 

反过来，如果对某个 . r 弇0, AA.r = Aj . 则冇两种可能情形： 

( a ) 和 * r 相关； 

( b ) Aj - 和 . r 无关. 

在前一种情存在菜个 //€(： 使得 Arspx , 这说明 p 珐/\的合特征值.另一方 而， A-r = 
AAj = A ( Ax ) = A (^)= / 7 AJ ==/ i ^ = I ,i I - x . 所以 I 户 ！ = fvX . W 为对任意 OeR , e 2， V 

是 f 应 f 合特征向的合«征值，由叱舟出十4是 A 的合特征值.注 息到 A 4( Ar )= A ( Air > = 
. A ( A ^)= A ( Ar )^ AAx ^ Xx . 因而,如果 4 是 A ? 的单特征值,情形 ( a > —定总会出现. 

在后 一种悄 形 （ 卜）（如果 A f 的亜特征值，就可能出现这种悄形 >• IpJM v = Ai+>/Ax 
是非零的，乂 W 为 

A). ■， AAj- 十 vH. = Aj- +v / A.A.i — +vXr > = v/Iv . 

所以 . v 是相 应于合特征请十^的异特 k 向 Ht □ 

我们已经®到，对个不 | rij 的非负特征值 • 都有 A 的一个相应的介特征向讨，这个 
结果类似于普通的特征向1 理沦. 下述结果乂稍微推广了这种类似忭. 

4.6.7 命题设给定的矩阵，乂设 I , , a ， … • a 是 A 的相; i 于合特征值 a , ， A 2 , 
…， A * 的合特征向如果当1</，浐）时， IA •丨关 U , | ，则 U ,， 心，…，是 
_ 线性无关向 M 组. 

证明： 每个，是 AA 的相应于特征值 | A •卜•的特征向由于向 M . r ,, 々，… • 心是矩 
阵 AA 的特征向域，社根据假设它们的特征值丨 A , | ,…， | A t | 2 是两两不 同的， 所以由 
(1.3. 8) 可知它们是无关的. n 

这个结果连同命题 U . 6. 6> 给出 了一 个已知矩阵的无关合特征向 M 个数的下界，由此得出 
可合对角化的充分条件，.这类似于我们所熟悉的普通的珥对角化的充分 条件. 在定理 U .6. 丨 1) 
中要给出更一般的条忡. 

4.6.»推论设是给定的 矩阵. 如果 AA 釘々 t V •异的彳 h 负特? f •值，则 AM 少有々个 
无关的合特? iF •向揪.如果々 =«• 則 .4 可合对角化.如果灸=0,则 A 根本没有合特征向贵. 
关于无 关的合特征向 W 的个数的这典界是可以达 到的. 对于这是一个基本 
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AA = ^(1) 以1作为它唯一的非负特 征值. 易知合特征向 M 方程 Ar = x 只冇实解， W 而每个 
合特征向 M 也是特征向«，且特征向 tt 组成的子空 间是一 维的.因此，对任意适合1<々<7^的 
幣数々，可以用基本 Jordan 块的直和给出这样一个矩阵的例子，使得 AA 有々个不同 
的非负特征值恰好有々个无关合特征向 M . 

我们的 R 的是要给出一个使给定的矩阵可合对角化的简单条件，作为第一步，先证明下述 
引理.提出这个结果是 W 为，如果某个矩阵 AeAt 合相似于一 个纯请 矩阵，则 
ASS 1 旦 /\ A = AS § 'ASS *= I A I 2 /. W ： 有 （ AA 是纯 M 矩阵）这个性质的矩阵是构成可合对角 
化矩阵的基本子块. 

4. 6.9 引理矩阵/有性质 AA = /, 当且仅当存在非奇异矩阵 S 6 M , 使得、 

证明： 我们刚 才已经 看到，所述条件是必要的.为 r 证明它是充分的，对任意 pc r ， 定 
id 或 e ' A 十 e ，，注意到 

• AS , - AU M 十 〆 n =十 ， A = /A + 〆 ，•/ = S ,. (4.6. 10) 

W 为 A 只有有限多个特征值 • 所以存 ftM 个 6 ieR 使得 一 r 不是/ \ 的特征值.对于0的这个值， [24.7] 

s 9u =- 

是非奇异矩阵，&由（4.6.10>有/\ =、,民 |) - 1 . □ 

我们现在可以叙述并证明珂合对角化的必要充分条件了. 

4 . 6 •丨丨定理则存在非奇异矩阵和对角矩阵使得/ \= SAS -' 当 
且仅当 AA 是具有非负实特征值的可对角化阵，且 rank A = rank AA . 

证明： 所述条件 M 然是必要的，因为 

AA = SAS ' l SAS' 1 = S U \ 2 S \ 

I 1 AA 的秩与 A 的秩都是 A 中非零对角元的 个数. 反之，如果 AA 可对角化且有非负特征值， 

则存在非奇异矩阵和 非负对 角矩阵 A € M •使得 AA =. Sy \ S -、 不失一般性，假定 A 中 
的相同对角元都排放在一起 ， R ASA ,、©》:/、© … © A */、， 其中/，. 且 A ^ A ^ Aa 〉 … 

> A t ^0. 于是有 

_ .S ' AA 5 = .S 'ASS l AS = (S l .\ S )( S 7 ' AS ) =丄 
如果令 h=.s MS ， 则 （ w 为合相似是等价关系>只潘 证明 . ^ nii = A 9 b 就可对角化.因为 △ 

是实矩阵， A^l = ( 巧 > = 二仙，所以 B 与 B 可交換 . BA = B(BB) = BBB=(m)B = 

AB •所以 H 与 y \ 也呵 交换. 如果把 B 表示成分块形式 


B {1 


…心 

B =: 

« 22 

• 

• 

• 

• 

• 


♦ •參 

• A 
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其中子块的阶数与 


248 


0 

A =丨 ••• ,/„ 6 ,I = 1，2,…，々 

0 X k I„ t 

的相应子块相同，则方稈 = 表明，对所有/=1, 2,…， 々有 A , B y = A , B „. 因为如果 
洋 i ， 则从垆 A , 推出，如果/关），则仇=0,因而 B 是分块对角矩阵 

B tl 0 

B= ••• 

. 0 B u 

其中， 对角子块与 A 的相应子块有相同的阶数 • 方程 = A 表明，对每个,=丨，2,…，， 

仪 , S „= A ,. 注意，如果 A ,>0, 必定是非负矩 阵. 所以，如架 A ,>0, 可以把这个方程写成 




W 时可以利用引理 ( 4.6.9>得出，存在非奇异矩阵 S.eAl , 使得队 > S ,. •• 如果 A * = 
0, 则 


rank + rank 此 2 + … + rank 〜 

=rank B = rank A = rank AA = rank A = ” + w 2 + … -f 

这表明 B *.* 的秩足芩，所以如采 A *=0， 则 fl 后一个子块 氏* 实际上必须足芩子 块. 这时，可以 

把心写 成0=〜=&(/厂/)义 、其屮 seM 、 是任意 非夺矩阵. 如果令 . s = S , ㊉ … © S , 
耶么所 有悄形 邰证明 r 


B = S( v/XT ® …㊉ >/X^K t )S 1 , 

这正是想要做的. D 

当把可合对角化的必要充分条件应用于定理 U .5. 15> 的情形 in<b> 时，有下述推论•如果 
给定 A，Aft Hermite 矩阵. B 是对称矩阵，且 A , «中至少有一个是非夺异矩阵. 
按 A 或 B 是非竒异 乐阵， 令 （:=A 或 U , A . 于是，存在非奇异矩阵 . SEM , 使得 SAS •和 
SiiV 都是对角矩阵，当且仅当 CT 可角化，其全部特征值是非负的， a rank (：=rank CC . 

A 足复对称矩阵的特殊情形容易通过定理 ㈠ . 6 • 丨 丨〉 来处理，闪为这时九 ^ = •是 

Ikrmite 矩阵. 对角化.另外，对任意 ACM，，rank .4 = rank /\ A ', 所以，当 A 是 g 
对称矩阵时，它满足定理的 假设. 定理说明每个复对称矩阵 0] ■合对角化，但是没有直接得出这 
[?19]时合对角化可经丙变换来实现这个 帛实. 参看本节末习题 22. 

关于合相似和合对角化的这些论断冇助于深人理解关于复对称矩阵的 Takagi 分解 （4 4 4) 
和关两相合 二角化 的定理 U . 4 . 3) . 定理 U .4.3 U 兑明每个使 AA 有全部非负特征值的矩阵 
AeM - 可两合三角化，而 Takagi 的结果说明每个 H 对称矩阵可以西合对角化. 

因为对于合特征值 • K 別“ 实”和“非实”没有什么用处，所以在类似于 Hermite (或正定>矩 
阵的“具有实（或 正〉 合特征值的可西合对角化，，与类似于正规矩阵的“具有复的合特征值的可两 
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合对角化”之间就没有什么差别.因此.复对称矩阵可以看作与整个正规矩阵类（关于普通的相 
似） 类似的矩阵类（关于合相 似）， 而 Takagi 分解可以看成与正规矩阵的谱定理 （2. 5. 4 a , b ) 类 
似的结果. 

普通的相似性理论的产生是由于研究不同基下的线性变换的结果.一般说来，合相似的产 
生是由于研究不同基 F 的反线性变换的结果.反线性变換 7' 是从一个复向《空间到另一个复 
向 鱿空间 的映射 V - W . 具有可加性[:7^+.>0 = 7>+7>对所有 * r , : vGV 成立],不过只 
rt 有共轭齐次性 「 T (^>=“7> 对所有和所冇 ifV 成立，有时称之为反齐次性]. 在摄 
子力学中，研究时间反转时要出现这样的变换. 

合对角化矩阵类是一个广泛的矩阵类，它包括 ft 冇实特征值的所有实可对角化矩阵，所有 
(实或复>对称矩阵，以及所有形如的矩阵 • 其中， H 是 Hermite 矩阵 • 而 S 是对称矩阵 
(阽本 fi ■末习题8和 9). 后一个论断为下述有 m 的充分条件中的第二个獒定了基础.正定矩陈 

M „ 是指对所有非零 j *€ C * 有 jV Ar >0 的非奇异 Hermite 矩阵;关于一个 Hermite * 矩阵 .4 
是正定的等价条件 tt ， A 的所有特征侉或对于某个非奇沣 Hermite 矩阵 H ， 有八= 
(见第7章〉. 

4.6.12 推论设 A , tl A 是正定的 Hermite 矩阵 • 

( a ) 如果 B 是 Hermite 矩阵,判存在华奇异矩 ft ,使得 SAS . W , 且 S /3 S •是实对 
角矩阵. 

( b > 如果 H 足 X 4 称矩阵，则存&在奇 >1■矩阵 SeM ”， 使得 S 九 S _=/， RSRS T ttH 冇非 
负主对角元的实对角 轵阵. 

证明： 设 A = // 2 , 其中 HeM , 足作 奇异 Hermite 矩阵. 

( a ) C=A l B=H 2 B , 所以 （？ 相似于 HCH 1 = H ( H =H * Bll 这是 

Hermite 矩阵,因而具有实特征值且可对角化:矩阵 C •也一定可对角化，且具有实特征值.因 
此 .4 和 B 可以通过 U .5. 15 U (丨 )》（ 2>的相合同时对角化.如果 f / [ BH • cLMU •其中 l/MH 
矩阵 R a 是对角 矩阵. 则非舒异矩阵 s = u - //•• 将使 sas - =/ a sbs - = a . 

( b ) C；=A l B=-H Z IU 所以 （ C;=H : BH ••月相似于 

H ( CC)H 1 - H l BH 2 BH 1 = (H l BH ')■, 

它钴 Hermite 矩阵 • 乂是 f 正定矩阵. W 而它可对角化 H 具有非负特 征值. 根据 （0.4.6 d )， 
rank(C C ) = rank ( H l BH !)' = rank ( '), 

再根据 (0.4.6 b )， rank ( H ! BH 1 ) = rank(H H ) = rank C . 因此，由 （4.6. 11) 知， （4.5.15) 
的条件^(^(^被满足，因而一定有非舒异矩阵、 S 6 M ，， 使得 SAS •和都是对角矩阵. 
注意到 H(、（H 是对称矩阵，因此根据 （4. 4.4), 存在 

西矩阵（/和非奇异对角矩阵工， 使得 H 、 B(H ] ) T = UI ： U T H l ) B ( U ' H = 2 .如 

果令 S = •• 则还有 □ 

我们已经 i 、 丨论 了各相似于一个对角矩阵的问题，但是不是毎个矩阵都可合对角化，因而自 
然要问，在合相似下任一矩阵是否可以化简成某种简单的 形式. 在合相似下，有一个标准形， 
它起的作用类似丁 Jordan 标准形在普通相似性中的 作用. 利用它，可以证明， 对紐个 AfM ... 





180 


第 4 章 


A 合相似于 A , A •和 A 7 ! 与 （3.2. 3> 比较],六合相似于？1^01^矩阵[与（4.4.9)比较], A 合 
相似于实矩阵，并且存在非奇异对称矩阵 S ,， S 2 6 M „ 和 Hermite * 矩阵 H ; ， 使得 A == 
5,片 1 =片3 2 |_与推论（4.4.11)比较].实际上，可以把整个合相似性的问题归并为一些更熟悉 
的 概念： 两个矩阵 A ， 合相似的必要充分条件是 （ a > AA 相似 f BS , 且 （ b)nuikA = 
rank B , rank AA = rank BB . rank AAA = rank BBB , …等对所有个这样的交错乘积均成 
立，其中乘积的项数最多是《个. 

习题 


1. 证明合相似性是上的等价关系. 


2o\ 
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2. 给出定理 U . 6. 3) 的证明细节. 


3. 设是一个给定的矩阵，且设 A 是 A 的合特征值.证明 A 的相应于 A 的合特征向世的 
集合不一定是 C 上 C " 的子空间，何它总是 R 上的子空间.试与 A 的普通特征向 M 的情形相 比较. 

4. 定理 (4. 6. 11) 给出了一个矩阵可合对角化的必要•充分条件，但是，当我们考虑多个矩 
阵时，它们可同时合对角化的条件是什么？设{/\,, A 2 ，…， A *} C ： A 1 是给定的，并且假定存 
在一个非奇样矩阵 "使 得对/ = 1，…， k ^ A ,= SA,S 』 i 每个九是对角 矩阵. 证明， 
( a ) 每个八可合对角化 ; ( b > 每个 A 叉.可对角化: ( c ) 乘积族/, ) = 1, …，幻是可交 
换的；（心对于所有 ,•，j = U k . A 人 + A , A , 只有实特征值而 A , A , — A , A , 只有虛特征 
值.当々=1时，这指的是什么？负实上 • 这些必要条件也是充分条件：关于其证明可参料 
(4. 5) 节末的“进一步阅读”中引用的 Hong 和 Horn 的 文聿. 

5. 矩阵 AA 在合相似性理沦起猗 承要的作用. 证明，对任 — 的特征多项式 
的系数都&实的.由此推出， AA 的任何 H 特征值必须成共轭对出现. 提示： dex ( tA - AAA ) 
= det A det (//- A /\) = det (//- AA ) dc ! A . W 此，如果 A 是非奇异矩阵，贝 ij AA 和 AA = 

的特征多项式 相间.对一 般悄形则考察 A,=A + e /. 关于 AA 的更为明确的 结果阽 七尠 8. 

6. AA 的非负特征值可导出 A 的合特征值，但是， .4.4 的不是非负的任一特征值也有意 

义. 假定 R 对某个 I 关0和某个适合 Ag [0， oo ) 的 成立. 设是 A 

的任一平方 根， R 川九？ = iv 定义向 M — v . 证明 ， Ay = a j ：. AAy - Xy , 及 a * 与夕 无关.提示： 
如果它们相关 • 必须是合特征向 M 且 A >0. 证明 AA 的所有复特征值必须成共轭对出现，玨 

的任一负特征值至少必须有几何 ® 数 2. 试与习题5比较. 

7. 设旦假定 A 是 AA 的一个实负特征值， A\s = Xs . a -^0, tt 2 = A ， Ai = av . 

= 根据习题6， O •和 y 是无关 的. （ a ) 设/ = 1 +/?)，， y ’ = y —^ j . 证明，对于分6(：的任 

-选杼，八？=以'且八>/=^. 0>> 证明可选择/?使/ 与: y # 正交，并且选这样一个戽 （ C ) 设 
.^^使产^是单位向量，乂设7=以’.证明， a 卜 a 7 ， A 7 = a f 和 f 7 =0. ( d ) 设^>0使/^ 
是单位向又设 L 7=[ 7 r 7 M 3 ." i / JeM ， 是酉矩阵.证明 


因而 


V AU = 

0 ra i ^ 

air 0 ; 


o r a ; 


，其中 A ' e AC 2 , 
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AO 

* 

0 A 

. 0 

a 


U. (AA )U 


) 由此得出，的每个负特征值有偶代数 重数. 试与习题6比较 • 

8. 对任意 A 6 M ,,， 证明 


•4 


01 r / .A - ] _ -0 
oJLo / ~ w.A 


A AA 


从这个明 M 的相似性推出， AA 和 AA 的有非零特征值的 Jordan 块之间存在一一 对应.因为 

■AA = AA , 证明 AA 的具有复特征值的 Jordan 块成共轭对出现.由此推出，对任一 A 6 R ， 
AA 相似于实矩阵. 提示： 参矜 （3. 4>中关 F 实 Jordan 形的讨论.还有一些结论实际上是成立 
的.事实上，人4总相似于一个实矩阵的 f •方.就 A 万的特征值而言，这意味卷什么？ 

9. 如果/相似十实矩阵 • 证明 A 相似于天（反之亦 然）. 利用这个负实和习题9证 
明，尽管—般不一定相似于但是，对任意 AA 总相似 f 月九 

10. 说明 中可 合对角化矩阵的集合包括以下 集合： （ a > 只冇实特征值的所有可对角化实 

轵阵. （ b ) H . 有〃个线性无关的实特征向域的所冇坷对角化矩阵. （ c ) 所有对称矩阵. （ d > 所冇 
正定 Hermite 矩阵. 提示： 如果 A 是正定矩阵，则 A = H ) R 1 : H 是非奇异 

Hemiite 矩阵. ( e ) 所有形如 AB 的矩阵,其中， A 是正定 Hermite 矩阵 • 而 B 是对称矩阵. 
这 与所存 形如 fT ’ fi 的矩阵的集合相同， ft 中， H 是非奇异 Hermite 轵阵， B 是对称矩阵.提 
示： H 2 B = H ( HBH T )H *. 

11•证明屮可合对角化矩阵的集合（7)~冇下述 性®: u ) 如果 Aera , ii se m , -ih 
奇异 , PW SAS l eCD „. ( b > 零矩阵在 C : 认中. ( c > 如果 A 6(7 入且 ci 6 C , maAeCD ,. ( d ) 
如果 Ae cd n 可逆，则 A 1 6 CD .. 

12. 证明， ( a )[^ 齊通意义下不能对角化，但它可合对 角化. ( b )[| 一^在普通意 

义下可对角化，但不能合对角化. （ c )^ 1 i 既不能对角化也不能合对角化. 

Lo 0J 

13. 如果其中，如果1»，则 A , 关 A >, 且所有 A ,>0, 
证明，存在两矩阵 L / eM . fi ^ A = L ^ ir . 且4=厶©…©4,其中每个是上三角矩阵. 

14. 引理(4.6.9>是说，对某个非奇异矩阵 SEAt ， A 6 M „ 有分解 A = SS M , 当且仅当 
AA = /. 试用 （4. 4.4) 证明 • A = L ^ d =【/ U f 对某个 两矩阵 L / eR 成立，当且仅当 A *=A 
且 A 是对称矩阵.这与 （4. 4. 7) 有什么关系？ 

15. 设 .46 A ^， 且记 A = B 丄 /(' 其中 i 3, CeM ,( R ). 证明. A 6 C 是 A 的合特征向最， 
当且仅当士 I A | 是分块矩阵 

• B (' - 

F== K e M2 ”( K) 

LC — M 」 

的（实）特征值. 提示： 用 1 = « +沁表示 Ai = rr , 心 v 6 R \ r = U | . 因而，如果 F 没有 
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实特征值，则 A 不可能有合特征值. 

16. 证明，如果 A 6 iVi 是对角矩阵或上二:角矩阵，则 A 的特征值与 A 的合特征值在下述 
意义下是“相同”的：如果 A 是 A 的特征值.则对所有/4是/\的合特征偵，乂如果" 
是 A 的合特征值，则对某个是 .4 的特征值. 

17. 如果 A 6 M „( R >, 证明， A 的每个实特征值也是 A 的合特 征值. 又如果是 A 的 
合特征值，则 p 或一户是 A 的特 征值.提示： 用 . r =« +， v 表示 ，“， v eR \ 考察例 

[Mil - P A= [_i U 以说明 • •- 个实矩阵可以有这样的作实特征值，它不与任何合特征值相对应. 

18. 当 w = l 时引理 （4.6.9) 是什么意思？ 一个 复数2位于复平而中的单位圆上是指 

1. 这个条件到矩阵的普通推广是要求=/:这样的矩阵称为两矩阵，它们在矩阵理论中 
起 A 承要的作用.另一个推广（当 w = l 时它简化成 M 样的悄形 V 足要求 = rfn •这些矩阵如 
引理 （1.6. 9> 所描述的那样合相似于申-位 矩阵. 证明 ，^ .46 M , RAA -/, 则 （ aM 是非奇异 
矩阵 * (b 〉A ,= 万《 ( c ) 丨 det A 丨=丨 A .- A , I =1; ( d ) 若 Ar =>U 且 t 关 0 , PJ Al = (1/ A)ii 
WiW . 只® A 是 A 的特征值， 1/ A 就& A 的特征偯.证明，荇 rGR . z 关士丨，则矩阵 B = 

L_!y :有如下性的消是 


W 此，这样一些矩阵的特征值不都位于单位 WI 卜.. 

19. 中实上，每个 a 矩阵 A € iW „ 可以写成八=尺/^其中•尺， f ；€ M ., R 相似亍实矩阵， 
,fiI f ; t =/ - 说明这个分 解坫如 何从讨个4€“”相似 r 实矩阵的班实得来的，并且解释 它是怎 
样推广了每个«数 c 可以写成==『一（其中 r 和0是实数）这个 节实. 

20. 证明定理 （4. 6. m 可以由本节正文 M / S —段中所述的两个矩阵合相似的一•般必要充分 
条件 推出.提示： 把条件成弔于/\和对角矩阵 A . 

21. 利用每个 AeAl ” 合相似于一个实矩阵的，实证明，如果”是奇数，则 AM 少必须有 
一个合特 征值. 提示：夺数阶实矩阵 尺至 少有一个实特 征倌. 关于 V 的特征值，这意味笤什 
么？ 如果 A 合相似于尺， AS 与尺 2 有何关系？ 

22. 设 A 6 M ., 是对称 矩阵. 定理 （4.6. 丨1>后面的讨论说明 A 耵对角化，所以，存在非奇 

异矩阵和对角矩阵使得 A ^ SAS - 1 . 说明，我们可以取 S 为两矩阵 [ M 而从定 
理 （4.6. 11>可导出推论（4.4.4>]’ 如下 所述： 注意到 A 的对称性推出 （ S . = 

A ( S ' S ) 7 . 利用极分解 （7. 3. 3> 把 S 写成 S = (7 P ， 其中，[；6从是两矩阵，•，是 
HermitcSi'Pi . 且对 T •某个多项式 p (/> ， . S) [见定理 （7. 2. 6) 的证 明]. 证明 JM = AP = 
AP T , 

[线 g 进一步阅读关于合相似以及一个矩阵族同时合对角化的问题 的更多 信息，可参看 （4 . 4 〉 

节和 （ 4. 5) 节末所引用的 Hong 和 Horn 的 文章， 也可参看他们的 报告 ： “A Canonical Form for 
Matrices under Consimilarily ’，，Linear Algebra Appl. 102(1988)， 143 168. 合相似的槪念 
[_ 吋作如下 推广：用仟意 域代替 g 数域且用该域上的自同构代替复共轭运算；见 Dac] ， p . 27 . 〃 
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5.0 导引 


考虑 （ T 中的若 〒个向 tt 或者中的茗干个矩阵，说有些向量或矩阵“小”，而说另一些 
向 M 或矩阵“大”，这是什么意思？在什么情况下可以说两个向 M “很接近”或者“离得很远”？ 

在二维及三维实向空间中，“大小”问题与“接近”问题通常涉及到 Euclid 距离. 向董 
: 的 Euclid 长度是（ 2 \广 2 = (5: 2 > 12 .按该度 M 标准如果这个非负实数较小， 就说 Z 
是“小向 tt ”. 此外，说向•和 .V 离得“很近” • 是指差2：=了 一: y 的 Euclid 长度是一个很 
小的非负实数. 

矩阵可以看成商维空 M 屮的向坫，那么矩阵的“大小”指的是什么？关于无限维空间中的向 
tt 的“大小”指的是什么？关于复向 M 呢？除了用 Euclid 长度以外，还有没有度*实向 tt “大 
小”的其他有效方法？ 

要冋答这些问题，一个 办法是 研究矩阵与向 tt 的范數或大小的度范数可 以矜作 Euclid 
k 度的推广，当然，研究范数并不仅仅是为 r 作一下数学推广而已.为了恰当地表达象矩阵 ¥• 
级数这样一埤槪念 • 范数是必不可少的，并钍在分析和评价关于数值计算的各种算法中，它也 
是必需的.此外，已被采用的各种不同的范数大体上可适用于各种场合，所以，研究所有范数 
所 Jt •有的一些件质，而不足把注意力集中到任 M 个別的范 数上， 这样做是可取的. 

下述各例从 儿个" 面说明引进范数的必要件. 


5.0.1 例（收 敛性） 如果』 •是 复数， IL I .r I <1,我们知道， 

(1 一 j ) 1 = 1 +•/• + /+/ + •••• 

它给出计 W 方阵 /- A 的逆的公式 

(卜 A> 1 = / + A +A 2 f + …， 

然 lW ，（ 彳么 时候这个公式才能成立呢？可以证明，这只要矩阵 A 的范数小于1就行了，并旦 
这对于任何范久也£如此！ H 样，利用范数可以证明，许多其他可以用来定义一个矩阵的矩阵 
值闲 数的*级数是收敛的， WiW 其定义是冇意义的，例如， 

eA ^S h A， 

就是这咩，为 f 按听要求的精确度计算一个特殊的函数值，范数也可以用来确定幂级数中所需 
要的项数.关于分析解方程组的迭代法的收敛性问题，也可以作类似的论述. 

5.0.2 例 （精 确性）设/是一个实变量的实值可微函数，我们知道，如果已知/( I )在 i = ： r 。 
的值 • 则/在其附近2=心+6的值可以用一阶导数 


/( J 0 +/ l ) — /(- To ) = 4 / ^ 
h ~ Ax = 



来 估汁. 因此，在计算/ 与心的 值时，如果实际上算出/在附近的值，那么，就有 
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—种估计相对误差的方法. 

关于矩阵计算也会出现同样的问题.假定想计算(或 a 的其他函数），但是 a 的各元 
是通过实验、通过其他数据的分析、或者是从先验的汁算得来的，并 a 不确切地知道这些数. 
这时可以把 A 看成一个“真”的 A 。 再加上一个误差 /：• 并且在计算 A l = ( A l +£： r - 1 而不是计 
算 A , 1 时，我们想（用 E 的“大小，估计珂能的“相对误差” • 知道 .4 1 与之间的相差稃度 
与知道 A 1的精确值可能是同样 ffi 要的，而范数为处理这类问题提供了一个系统的方法. 


5. 0.3 例 （界〉 对于与矩阵相关联的一些東要的 M (例如特征值）的界常常要涉及范数，当矩阵 
产生扰动时 • 这些 ft 的可能变化范围也要涉及范数. 

5. 1 向量范 数和内积的定义性质 

我们先考虑向 tt 空间上的 范数. 由 fAl 是向 M 空间，要做的一切也将适用于矩阵范数. 

一个函数如果是范数，它裔要具备哪些性质.为 r 说明这个问题 • 对熟知的（实或复）纯姑 
的绝对值槪念进行 抽象. 当然，一个值得注意的差別是，绝对值函数是实变攢或 g 变《的实值 
函数，而我们要求范数是描述一个向 M 的多元实值 函数. C * 上的这样一个函数是 Eudid 长度 
但是还有另一些函数也具有 Euclid 长度的某些基本性质，并且在某些场合可能是更 
为合适的度 W ， 它们可能提供另外的信息，或者在某些内容中使用起来可能更为方便. 

在整个这一章中，只考虑实或 复向世空间. 所有的主要结果对这两个域都成立，不过在每 
一个结果中，它必须与所采用的那个域相 一致. 我们常用域 F (—开始就视1^=只或0叙述各 
个结果，之后，在余下的沦述中涉及的是同一个域 F . 

S .1.1 定义设 V 是域 F(R 或 O 上的向址空间.函数 Ml : V—R 称为向 量范数 ，是指对所 


有 . r , 有以尸 性质： 

(1) || j - || ^0, 非负性； 

< la ) ll-r II =0当且仅当 .r = 0, 正定性： 

(2) || cu - || = | c - | IUII 对所有纯 Mc€F 成立， 齐 次性； 

(3) II v || < IU II + || || ， 三角不等 式. 


这四条公理是大家所熟悉的平面上的 Euclid 长度的几个性质. Euclid 长度还具有另外一些性 
质，这些性质与这四条公理是独立无关的[例如，平行四边形恒等式 （5. L 8)]， 因为它们对于 
一般的理论并不是必不可少的，所以没有把它作为公理. 

_ 一个函数如果满足公理 （1), (2>，（3>但不一定满足 （ la )， 就称之为向量半 范教. 半范数 

在允许某些非零向 M 有零长度方面推广了范数概念. 

5.1.2 引理如果 IIHI 是 V 上的向 M 半范数•则 

I II ^ II — II ^ II I < il j 一 ，II 

对所有 I , : y 6 V 成立. 

证明： 因为） _ = * r +(： y —由三角不等式和齐次性公理（2)，有 

II W < IUII + Lv — xll = !UI| + ||x-^ll. 
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由此可知 

II)，II 一 IUH < IU-.yl|. 

乂因为 >r = ： y + U — _ v ), 所以再由三角不等式有 

IU II < 11).11 + lU-yll , • 

因而 

IU II - II 3^ II < IU —yll. 

W 此我们证明了士 Ul ill - II ^ II )< IU — y!l ,它等价于引理的论断. □ 

与 C ” 上 Euclid 长度相关的槪念是通常的 Euclid 内积(有时叫做“点积”），它有一些性 
质与两个向 M ： 间的“夹角” 有关： 如果 yx = 0, 那么^•与 y 正交.正象对向 M 范数所做的那样， 
可以抽象出 Euclid 内积的几个本质特征，并且用它们作为一般内积理论的公理. 

5.1.3 定义设 V 是域 F(R 或 C ) 上的向 M 空间， 函数< • ， • >: VXV—F 是一个内积，是指 


对所有 * r ， _y • z 6 V ，有 

(1) * r > 彡0， ' 非负性： 

( la ) <- r . x >=0 当且仅当 * r =0, 正 定性； 

(2) <,r + )，， z >= < j ， z >4 ( y , z ) . 可加性； 

(3) <(* r ，）0 = rU ， 对所有纯 tt (€ F 成立 • 齐次性 》 

(4〉 〈 j *， y )-- ( y 9 x ) * Hermite 性 • 


炼习 证明 Euclid 内积 〈 I, = 满足关于内积的所有上述四个公理 . 

练习设 Z ^ diagW , • ， …， cl ”、 ， 考虑函数 （ j ， y )= y ' Dx , < • , • >满足关于内积的 

哪几条公理？ I )在什么条件下 <• , •> 才是内积？ 

练习由定义 （ 5. 1.3) 的四条公理推导内积的下述 性质： 

(a) <*r ， cy)=c <•/., y) i 

(b) <j .， y-\-z) = <x. y) + (x 9 z) \ 

(c) <ax + by, cu*-\-cJz) — ac <x, u*)-f-/x- \y 9 w) \ ucJ <x, z)-\-bd {y, z) \ 

<d) <x, 乂 >=0 对所有）成立，当 R 仅当 j* = 0: 

(e> < ，， < ，， v>v>= ! <x. y) I 2 . 

所有内积都共有 的歌要 性质是 Cauchy-Schwarz 不等式 . 


5. 1.4 定理 （ Cauchy - Schwarz 不 等式） 如果 < • , • 〉 是域 F ( R 或 C 〉 上的向 撤空间 V 上的内 
积，则 

I 卩 < (x,x)(y 9 y) 

对所有 . r , 成立.等式成立当&仅当 o •与 y 线性相关，即对某个 & F 有：=< ^或 
证明： 设 x ， ： y € V 是给 定的.如果 ; y = 0, 则结论显然成立，所以可以假定 y 关 0. 设 
K ， 考虑 />(/) 三 〈 j +/. v ， x -\~ ty ) = ( x t 十/ ( jy ，* r >+/< j , y )-^ r ( y , y ) = ( x 9 j > + 2, Re <* r , 
y )-^ r ( y 9 y ) t 它是实系数二次多 项式. 由公理 （5. 1. 3( 1 )) 得知，对所有实数/, />(/) 多0 ， W 
而 〆 r ) 不能有实的 单根. 因此， 〆 /)的判别式一定是非正的，即 

(2 Re ( j * v > ) ? — 4<^* v >< j , j *> <0， 
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因而 


{Reix.y)) 2 < (5. 1. 5) 

因为这个+等式对任一对向都成立，所以当用<1，代替7时它也一定成立.于是还有不 
等式 • 


( Re < j -,< xo ^3^ )： ^ ( jr . sHyfy ) | ( s , y ) | 2 . 

但是， Re < a *, < j -* > y > < y > = Rc <* rT ^><* r ， v > = Re I <j , v > | 2 = I < jr , y ) |-, 因此 

I <J •，夕 > I ’ < ( x . xHy . y ) | ( s , y ) \ 2 . (5. 1.6) 

如果 （_ r , y)=0, 则定理的结 论是敁 然的；否则可以用数 I 〈 I , ： y> I 2 除 （5. I . 6) 两边得到所要 
证的不等式.因为公理 （ la >， 所以仅当 *r + /：y = 0 对某个/成立时 p ( r ) 才有一个实（二里:>根. 
W 此，在判別条件 （5. 1.5) 中等式能够成立，当 ft 仅当 I 和； y 线性相关. □ 


S . 1.7 推论如果〈•，•〉是 V 上的向 M 内积，则 IUII =(< 1 , * r >) l/2 是 V 上的向量范数. 

绦习证明 （5.1.7). 提示： 只冇三角不等式的验证不明 M . i | •算 || i + y II 2 ,然后利用 
Cauchy-Schwarz 不 等式. 

如果 IMI 是适合 IU || =< j *, 的向 W 范数，其中 （•， •〉为某个内积，就称该向世范 
数可由内积（即〈 • ， • 导. 

习题 

1. 设^表示 C ” 中的第*•个单位坐标且假定 M | 是 C " 上的一个向《半范数，证明 

II -r II < I ； I - r , lil ^ ll . 

i •雇 

2. 如果 INI 是 V 上的一个内 £# 范数. 证明 Ill/ll =0} 是 V 的一个子空间 
(称为艾于 IH 的零空 /•]; 如眾 V ,尨 v 的适合门 v , = <0} 的任一子空间，证明|卜||是 
V ，的一个向 M 范数. <;、>芩 衍 

^ y 当 J 1 仅当 II II =0 

定义的关系〜 y 证明.〜足 V t. 的一个等价关系，而这个等价关系的诸陪集具有形式 i = 
{j'-f-vev * .v6V„K 并 I! 这些陪集的集合以一种自然的方式构成一个向 M 空间. 证明，闲数 
II: II三< II ^11 是存意义的，并旦是诸陪集组成的向 m 空间上的一个向 m 范数. um 

明与每个向量 f •范数有关的然范数为什么 存在. （ d>|| jJsO 是半范数吗？ （ e) 给出一个不 
是范数的非平凡半范数的例子. 

3. 证明，如果定义两个非零向请间的夹角是介于0与 tt /2 之间的值 

•I / I <J fy > I \ 

\( U ,^ Hy , y )) l ,2 l 9 

262] 则这个夹角槪念对任何内积都是有意义的. 

4. 证明，如 （5. 1.7) 中由内积诱导的向贵范数 一定满 足平行四边形恒等式 

}(IU + jjl 2 + llx -^ ll 2 ) = IUIP + II ^ II 2 . (5. 1.8) 

为什么这个恒等式得此名称？事实上，等式（5.】.8 》 是一个给定的范数可由内积诱导的必要充 
分条件.见习题 10. 
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5. 考虑定义在 C " 上的函数 lUlU ^ max^M U . | • 证明|| • IU 是不能由任何内积导出的 
向敏 范数. 

6. 如果|卜||是由内积< • ， •> 诱导的向#范数，证明 

ReQ "〉 = p || _r 十 .V I 卩- ll*r —) l | 2 ). (5.1.9) 

称这个等式为极化恒等式，同时证明 

Re < u > = |(|U + . V | 卜 II x II 2 - || ^ II 2 ). 

7. 证明， C ” 上的^范数 lUII ^ U , 丨+…+丨 a | 适合公理 （5.1. 1>,但不适合极化等 
恒式 （5. 1.9). 因此，它不是由任何内枳导出的. 

8. 如果 Ml 是由一个内积诱导的 V 上的向铖范数.则 

ll-r+vll Hull < IUH 2 + lb II 2 

对所有 I ， 成立. 什么时候等式成立？这个不等式对所有向 M 范数都成立吗？给出这个 
不等式的几何解释. 

9•设 x 和 y 是 V 中给定的向 V 有一个由内积< • ， • >诱导的范数 Ml ,并 il 假 
定 J 是非 零的. 证明，使 lU - wll 的值达到极小的纯 hu , •是办二 <. r , 3 ^)/ II 3^ II 2 .并且 
』’一 a u< y 与 _y 正交. 

10. 不难证明（但也有一些技巧），平行四边形饵等式（5.1.8〉是一个给定的范数可由内积 
i 秀分的充分 条件. 首先考虑 R 上的一个向 M 空间. 设 Ml 是 V 上一个给定的 范数. （ a ) 定义 

<-,) =■ 中 J 11 U 2 . (5.,.,0) 

证明. 用这种方法定义的< • • • 〉满足 （5. 1.3> 中的公理 （1), ( la ) 和（4)， &〈 j , i > = 
II x || 2 . (b> 利用 （5. 1.8) 证明 

4<x,y> + 4<* ，夕 > = 2 || I + ：y || 2 + 2 II: + ：y || 2 — 2 || I || 2 - 2 IU |1 2 — 4 || y II 2 

=II *r + 2 ：y + z || 2 — || j + HI 2 — 4 || ：y |卩= 4 〈《r + z , y ), 

由此得出，它也满足 (5.1.3〉 中的可加性公理 （2). (c) 利用可加性公理证明， Ui, / = v > 
且 1 盯， >») = <«. r , ^> = w < j -, v >, 其中 m 和”是非负 盩数. 利用 （5. 1.8〉以及 （5. 1. 10) 证明 
〈一 *r，>r> = -<j*, y > 9 由此得出 〈“ y >= aU 9 y ) f 其中是有理数. （ d > 设 />( f) = / 2 |U || 2 
+ 2 心， y >+ ILv|| 2 , /6R ， 然后证明，若 / 为有理数，则 〆 />= ||以+ >|| 2 .由 />(/) 的连续性 
推出，对所有 r € R ， / >(/)^0. 根据 〆。的判別式一定是非正的事实推出 Cauchy-Schwarz 不 
等式丨 <o •，/ l 2 < II -r || 2 || .v || 2 . (e> 现在设 ci€R 是给定的，证明 
1 ( cu '^ y ) — a< j-.y) I = I 〈（“ 一厶〉 j，，〉+ ( 厶一 “><. r ，. v > I 

<1 ((ci-b)x,y> | + | (b-a)U 9 y) |<2 | a-b \ |U || || ^ || 
对任何有理数 6 成立，并且可以使上界任意地小.由此得出 （5. 1. 10) 满足 （5. 1.3) 中的齐次性 
公理 （3). 这就证明了<•，.彡是^上的一个内积. 

细心的读者会注意到，在上述论证中关于范数 | 卜 || 的三角不等式 [(5. 1. 1) 中的公理 （3)] 没 
有 用到. 因此， （5. 1. 1>中的公理（I). (la) 和 （2) 连同 （5. 1.8) 蕴涵以下 事实： 函数 IH 是由内 
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积诱导的，因而它是一个范数，并且一定满足三角不 等式. （ f ) 若 V 是一个复向话空间，定义 



〈工，/的实部是 V 看作 R 上一个 向置空 间时的内积.利用这一事实和 (5.1.8) 证明〈•，•>是7看 
作 C 上一个向《空间时的内积. 

进一步阅读平行四边形恒等式是一个给定的范数可由内积诱导的必要充分条件，这个结 
果的最早证明似乎应该属于 P . Jordan 和 J . Von Neumann , 他们的文章是 “（)n Inner Products 
in Linear Metric Spaces , Math. 36(2)(1935), 719-723. 习题 10 中所给出的这个结果 
的证明参考 r 下述文章： D . Fearnley-Sander and J . S . V . Symons , “Apollonius and Inner 
Products ，” Aw €* r . Math. Monthly 81(1974) * 990-993. 

5.2 向 量范数 的例子 

下面所列举的是一些常见的向蟥范数的例子. 

5.2.1 C " 上的 Eiiciid 范數（或/_，范数）是 

II 11 2 = (I - T , P + w + Ia |:)|' 

这也许是大 家锒熟 悉的向》范数，这是 W 为|| 1 一>»|| 2 能度莆两点 J .， J 6 CT 之间的标准 Euclid 
距离.这个范数还是由普通的 Euclid 内枳导出的；即 iui |! = <« r , 

缠习 验证 || || 2 是 （T 上的向 M 范数. 

练习范数 HI 称 为酉不 变的，是指 || ar || = ||« r || 对所有和所有两矩阵 L/eR 
成立. 证明 Euclid 范数 H | 是酉不变的. 

5.2.2 C 上的 和范教 （或范数）是 

II ^ III =1 -**1 |+ …+| 

W 为 Kfc 度只是沿各坐标方向的直线度量，这个范数也称为1 一范数或更风趣地称为 
Manhattan 范教. 

练习验证和范数是 CT •上的向撤范数，但不是由内积导 出的.提示： 利用（5.1.8〉. 

5. 2.3 C " 上的极大范数(或 /... 范数）是 

II j II.、，= max{ I a I，…， | a •胃 | }• 

练习证明 HU 是 C ” 上的向 M 范数. 

练习 II • IU 是由内积导出的吗？ 

5. 2.4 CT 上的/,范数是 

II ^ Ha = ( 2 I \ P Y P yp > 1- 

卜 I 

练习 验证， 对于/>>1，每个范数是 C •上的向请范数，且对于每个 xec ", II X II .,..= 
^rnlU t . 提示： 只有三角不等式是较难验证的 公理. 关于范数的三角不等式是称之为 
Minkowski 不等式的 经典不等式. 
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练习给出一个不是 G 范数的向撥范数的例子. 

上 述各个向量范数的例子都是 C ” 上的范数，不过还能用它们来构造任意有限维实或复向 [265 
量空间 V 上的向 ft 范数，如果 …， 以 M 是 V 的基•则 

M 

X —[. r ],= : e c \ a = 力“ ， 

息 

Lr^J 

是 v 到 c * 上的 同构. 如果 IH 是 c ” 上的任 • •向 M 范数，则不难证明 

II j - iu = II \\ = n [ji . j'.y ii ， j 

是 v 上的向 a ： 范数. ' 

练习 验证鍛 后一个结论. 

称矩阵 BeM „ 是关于 cr 上的 向量眾 a !;•« 的一个等距变换，是指 

I ； i, - il j- || 

对所有』 ec ” 成立. 

练习证明，关于任何向没范 ft 的等距变换一定是非奇异矩阵. 

练习证明，关于给定趵向燴范 Siv 各换等距所组成的矩阵集合构成一个群（称为该 
范数的等距变换群）.除了 PWK 以外 ， M II - II ,,还存在任何等距变换吗？ 

练习证明，和范数的'？ 距变# 群是那样一些矩阵组成的集合（群），这些矩阵#上去 
悚罝换矩阵，只是其中的元素“+1”用绝对值为1的任意复数来代替. 

练习极大范数的等距变换群是什么？ 

向 tt 范数的定义并未要求向《：空间 v 是有限维的.例如 • 空间 v 可能是实区间[〜 6] 上 
的所有实或 S 值连续函数构成的向 掛空问 （1>,幻. • 

5.2. S 例（:[“， 6] 上的某些范数例子类似于已经对 cr 定义的诸范数.例如， 


II / lia = [| 1 /(/) Pd/ 

i t 

• 

U 范数； 


II / Hi ^ J 1 f ( t ) 1 d/. 


U 范数； 

|266| 

II / K = [\[ 1 /(/) \ p dt ~ 

， P >\， 

1” 范数； 


II / II = max{ | fix ) | : 

-r €:「“•&]>， 

L . 范数： 



它们都是 （’[«• 6] 上的范数 . 

习题 

1. W: 明， 如果 0</»<K 则（ 3.2.4> 定义 C 上的一个闲数，除了向 M 范数的一条公理以 
外， 这 t 闲数满足所有的 公理 . 它不满足哪条公理？试给一个例 

2 . 设 /e (•[()• 1_J. W : 明 ilyl -lim ! / Ii p . 

於 • • 

3. 关于（、[0,丨1上的；其三角不等式看来与什么一样?对于 C ”， 如何从 Minkowski 

不等式（附汆 B ) 出发去证明这个 '角不 等式. P 
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4. 设/>,, /> 2 ,…，/>，是给定的正实数.下面哪一个是 C ” 上的向景范数？ 

( a ) || x II = ^ p , II ， 

( b ) || a - || = ( 2 A I J *. I 2 )' " * . 

i «-| 

(c) II x || =max{p l I A I ，…， />, I J-. I }. 

5 . 设 々 eh , 是给定 的点. 证明，如果则 C [«， /，]上的函数 ll / L n = I /( 為> 丨是 

半范数而不是范数. 

6. 如果 HI 是 c ” 上的西不变向娬范数， 证明 ， Ml = a HI 2 对某个 a 〉0 成立，且||_|| 2 
是使 II e , II =1的唯一酉不变向量范数. 

7. 证明， || y |L , = max ^ #i -, I y's ； 0. |i .r j |, =max ： yh i x'y \ . 

8. 试用前面的练习证明，如果/ V 在和范数的等距变换群中，则 Aft 极大范数的等距变换 
群中，反之亦然. 

9. 所有4范数的所有等距变换群的交是什么？ 

[267] 进一步阅读关于 Minkowski 和 Hblder 的经典个等式的详 细讨论 町参: BB ]. 


5.3 向量范数的代数性质 


从任意一个或几个给定的范数出发可以用多种方式来构造一些新的范数.例如，荇易证 
明，两个向 tt (半）范数的和是一个向 ft (半）范数 • 一个向 W (半） 范数的仟意正数倍又是一个 
( f :) 范数.按另一种方式也不难证明，如果 INL 和 IH # 是向 ft 范数，则由 IMI 三 max { IMI 。， 
II .r Ip 定义的函数 HI 也是向《范数.这些论断都是 F 述结果的特殊情形. 

5.3.1 定理如果 HL , ，…， iHt 是域 F ( R 或 a 上的向域空间 v 上的向 M 范数，乂设 HI , 
是 it 上的向》范数，使得对 fl •有作负分 M 的所冇 air 都钉 II ^ + ^ ||,,则由 
IUII = ||[ IU || •丨 ，…， IUI|%] r I 定义的函数 III : v — k 是\/上的向#范数. 

定理中关于范数 I 卜 Ik 的申调 性假设可确保所构造的*数|卜||满足-角不等式.所有的范 
数都具有单调性这一性质， * r 上的任一向墩范数1倘若只是 | 的分 M 的绝对值的函数，该范 
数也具有申 W 性 这-性质； 见 (5. 5. 9和 5. 5.10). 但是，冇一啤向 鼠范数 不其有这一性质. 

练习证明定理 （5. 3. 1). 

练习证明两个向 tt 范数的和或取极大仍是向 M 范数的 奉实是 定理 （5.3. 1>的特殊情形. 
关于取 极小乂如何？ 

练习设 w = 2, V = R 2 且 IU 1= I - r ,-. r 2 I -f \ j 2 \ . 证明， Ml〆 是 R ? 上的向 M 范 
数，但函数 II j II e || [ || : ||„， || j * m l ^ min ^ I . I * r 2 n + I a I + I « r 2 I 不是向 
M 范数 • HI 满足哪儿个向 M 范数公理？ 提示 ：考察 lU + . vll , U || 以及 
\\ y \\- 这与 （5.3. 1) 矛盾吗？ 

从旧范数构造新范数的另一种方式是由下面的结果给出的. 
s .3.2 定理如果 HI 是 c ” 上的向请范数.乂如果 reM , 是非奇沣矩阵，则由 
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lUllr- II Tx || , X ^ C 
定义的 Hl r 也是 C " 上的向 《 范数. 

练习证明 （5.3.2). _ 

练习在 （5.3.2) 中如果7•是奇异矩阵 • 结果有何变化？ 

练习为什么 IU ||=( | 2^-3^ I 1 + U 2 I 2 ) 1 ' 2 —定是 C 2 上的范数.(清不用计算！) 

利用对偶的槪念可以从旧范数构造新范数.这种方法在 （5. 4) 节未讨论. 

习题 

1. 如果 HI 是向 M 半范数，证明，对任意： IUi | r = II 7>||也是向•范数.如 
采 II • II 是向 W 范数，则 Hl r 是向 M 半范数，它的零空间就是了的零空间. 

2•证明，任何向范数都具有形式其中， Ml 是某个向 M 范数，是某 
个矩阵. 

5.4 向量范数的分析性质 


前两节中的各个例 f 淸楚地说明 • 有汴多各不相 N 的函数 HI : V - K 满足范数的各条公理. 
这样，有多种不同的范数河供选用.这 坫很打 川的， W 为对于某种应用来说，一种范数可能比另 
-种范 数更方便或更 合适. 例如，/ 2 范数用于优化问@往往是方便的， W 为（除 /原点 以外）它是 
连续 "了 微的.另一 方而，6范数51然只 A —个较小的集合 t 可微，但进它在统计学屮较为通用, 
W 为它 （是〉 导出的佔汁可能比经典的 HP 估计更有说服力 • /. 范数汴汴用起来是 KA 然的范数, 
W 为它莨 接检验各个分 W 的收敛性，然 iW ， 遗憾的 fi , 不论 ft 分析上还是仵代数 _ h ， 它使用起来 
坷能都不 方便. 在实坏应用中，基 r •一种范数可以很 ft 然地達立起一种理论， 与在 某种场合很容 
易计算这种范数"丨能>(、 足一 M 事 . W 此，知道两种不 N 的范数之间可能存在什么关系是很里要 
的. 卒:运的足， A 冇限维情形，所冇范数都在某种很强的意义下迤“等价”的. 

分析中的 S •本槪念是序列的收敛溉念，而向 M 范数可以用来度 W 向社序列的收敛件. 


5. 4.1 定义设 V 是 R 或 C 上的向敏空间，且|卜||是 V 上的范数 

关于范数 HI 收敛于当且仅当々* -⑺时|| x { kt - x \\ —0. 

如果{/ 4> }关于范数 IH 收敛于 _ r , 则记 

/*’ 下7广 I ，或关于 IMI »lim x u, = jc . 

应当弄清楚的是，上面提到的收敛性与哪〜种范^有关，于是，关于一个给定的向 M 序列 
是否吋能对一种范数收敛而对另一种范数则不收敛的问題提出 来了. 这种二 S : 性在无限维空间 
中可能出现. 

5.4.2 例考虑（:[0，1]([0， 1] 上的所有实值或复值连续函数组成的空间）中的函数序列 
{/ 山定义如 F : 对々 = 2，3, 4,…， 

/*( x )=0, 

fAjr ) = 2 ik 32 x - k l 2 ), 



，说 V 中的向设序列 U u> } 

[269] 




/*(j ) = 2( - 々 3/2 j 十 
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于是可以算出， 


A ( j *)= o , 


当务 




时， li A II ,=令 


对所有 1#/* ll 2 


R. || Jk \\2 = 

当务 — ⑴时 ， ||/ 4 IL = k l/l - OO. 

所以，关于 lim /*=0, 但是关于其他两种范数就不为零. 

练习画出上例中所描述的各个函数的草图，并且验证关于 L ,, M 和范数所做的论断. 


练习设 HI 是向*范数，如果 


y 利用三角不等式证明因 


此，关于给定的范数，讨论一个序列的极限（如果冇的话）是有意义的. 

所幸的是，例 （5. 4.2) 中出现的现象 ft 有限维向 坫空间 的情形不可能 发生. 为了肴出这 
点，需要一个关于范数连续性的一般引理. 


5. 4.3 引理设 HI 是域 F(K 或 C ) 上的向 傲空间 V 上的范数，乂设…，：是 
给定的向 M . 则用 

giz lt Z 2 f — 9 Z m ) = II 2, x u， 十 十…+2用 J •(… II 

定义的函数 f - R 是一致连续的函数. 

证明： 设 S >,* r “>和 v = ，•经 计算， 

1 叫 <• 1 

|g( M| 《 (V, ，一， lO 丨=丨 II M II — II V II I < !| « — V II 

= 公 （ M •一 认 )？” || < 公 I 一 扒 I II j 。 1 II < C’ max I M, — 队 I ， 

其中 C ； E W II J •… || • 第一个不等式可由引理 （5. 1.2> 得到.注意，有限常数（：只依赖于范 

数 HI 与⑺个向如果向都是零向域，则无需证明，否则有 C > o .为 
了使丨—紅 U ， …，丨 <6 ,我们只需选取 | “•一 的丨 < e / c . □ 

虽然引理汴未要求向域空间是有限维的，但是，向掛/“的个数有限是很 fi 要的. 

练习试用这个引理推出， R ” 或 CT 上的每个向 M 范数都是一致连续 函数. 

然而， K 的有限维性质对下面的基本亊实是必不可少的. 


5.4.4 定理设/,和/ 2 是域 F ( R 或 O 上的有限维向空间 V 上的两个实值闲数，乂设 j = 
</"，…:是 V 的基. 假定/,和/ 2 是 

( a > 正 定的： 对所有 jev 有/,( 1 >彡0, /,( J )=() 当且仅当 j =0: 

(b) 齐 次的： 对所有 a6F\ V^, /,(aa >= 丨 a i /,(.* ) ； 

( c > 连 续的： //•/•&)) 在 F ' 上连续 • 其中 

-= Izx '6 F" R .r (: r> 三： r,«r ,M + … f- z v j- , n \ 
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则存在有限正常数 C * 和〔„,使得 
对所有7成立. 

证明： 我们在 Euclid 单位球面5=46广： IUII 2 = 1} (它是 F 中的 紧集〉 上定义三 
f 2 ( x ( z ))/ f l ( x ( z )). 由 （ a > 可知， / Kz ) 的分母在 S 上不为零，因而根据 （ c ) 可知 / Kz ) 在 S 上连 _ 
续. 由 Wd ers t ras s 定理 （阽 附斌 E >, 连续函数/»在紧集 S 上达到一个有限的正极大值 C M 和一 
个正极小值 C w , 因而 

C (f /,(a-( 2 ： ))</ 2 (x(2)X Cm/,(j-(s)) 

对所有成立. 由 Tz / IIHkeS 对每个非零成立， （ b ) 保证这两个不等式对所有非 
零 zer 成立； 因为/, (0) = 0, 所以它们对 2 = 0显然 成立. 但每个都具有形式 z = 

• r ( z )， 其中为某个向量，这是因为3是基，因此要证的不等式对所有 成立. □ 

定义设 V 是实或复向# 空间. 函数/: V — R 如果满足定理 （5. 4.4) 中的正定性，齐次性 
和连续性等三个假设条件，则称这个函数是准范數. 

当然，一类准范数的最*要的例子是向《 范数； 引理 （5. 4.3〉说明，每个向馕范数满足定 
坪 （ 5.4.4>的连续性假设 （ C >. 一个满足三角不等式的准范数是向世 范数. 由于这类范数 的東要 
性，我们把这种情形卩所得到的结果叙述成下面的推论. 

5.4.5 推论设 IM 。 和 IH , 是有限维实或复向佾空间 V 上的任意两 个向嫩范数. 则存在有限 
正常数和 （: M 使得（: IL < IU li ,< C： w il x II •对所有 V 成立. 

练习 （5. 4. 5) 为何对向«半范数不成立？ 

练习设 x 2 yeR \ 且考 isw 上的下列两种 范数： iuil = il [ io Jm jc 2 y ii ., 

和 I; il# il [a • \ox 2 y ii.. 证明函数 /<j)=( ii x ii. ii ii^ 1 ' 2 是 r 2 上的准范数而不是范 
数 . 提示： 考虑 /([I, l] r ), /([0, l] 7 ) 和 /([l, 0] r ). 

练习如果 II • ll a , ，…， II • IL , 是 V 上的向 ft 范数，证明， /( I ) 基 （II I || #| …， 
\\. r \ l t r ^ VJi ( x )= m \ n { iUII .,, -• ||1«〜}是^上的准范数，但不一定是向 M 范数. 

(5 1.5) 的一个推论3，有限维 S 向摄空 间中的一个向馕序列（关于 范数） 的收敛性与所采 
用的范數无关. 

S .4.6 推论 HL 和 HI # 是有限维实或复向*空间的向徹范数，乂如果{/，是给定的_ 
向 M 序列，则关于 IhiL 有 jimj •… =1，当且仅当关于 HI# 有! imi … =x. 

证明： 囚为 C ， il 〆 *，一 J . IL < II ■!* …一 iKG, II J •…一 I II•对所有々成立，由此可知，当 
OC 时， If ^*>-^|| 0 _0当且仅当 || 11,-0. 

5.4.7 定义两个范数称为是等价的，是指只要序列彳心}对第一个范数收敛于向莆 . r ， 则它对 
第二个范数收敛于同一向因此 （5. 4.6) 是说，对有限维实或复向 f 空间 • 所有范数都是等 
价的. 在例 （5.4. 中已经看到，在无限维空间中两个范数可以不等价. 

由于 R ' 或 C N 上的所有范数都与|卜||,,等价，所以对任何向量范数有当且仅 
当对所有/ = 1，2,…，《有 
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这就是说，（关于任一 个基） 依分镇收敛等价于对任何向 tt 范数收敛. 

在有限维情形，关于所有向 W 范数都等价的 另一® 要推论是，每个向 tt 范数的单位球及单 
位球面是紧的.这个事实蕴涵仟意向请范数的单位球 h 的连续复值函数是有界的，并且，如果 
这个函数是实的，则它达到它的极大值和极小值. 

5. 4.8 推论设 V 是 R ” 或 CT . 设/(…是 V 上的准范数.则集合和 U : f ( x ) = 
U 是 紧的. 特別是，如果 HI 是 V 上的向 M 范数 • 则闭单位球 {. r: ||1||<1丨及单位球面卜： 
II .r || 都是紧的. 

证明： 由 （5. 4. 4), 存在某个（〕>0,使得 II 对所有成立，所以集合 

/(• r )< l > 是有界集，它包含在一个半径为 C ， 中心在原点的普通 Euclid 球中. W 为 /(•> 连续， 
所以集合 U : /(d = l ( 与 U : /(* r )< U 都是 闭的. 由于 R •或 C ” 中的有界闭集是紧的，我们 
完成了证明. Q 

我们遇到的问埋常常不是判定给定的序列是否收敛于某个给定向量 I ，而是判别给 
定的序列是否收敛.因为这个缘故，需要冇一个收敛性判別准则，这个准则与序列所收 
[2731 敛的极限 I 没冇 关系. 如果存在这样一个极限那么，当6、）一00时， 

II ，一， 卜 II?• ，一 I + I - y>， II < || ，一刘 | + ||n …| 卜 0 . 

这是促成给出下述定义的原 W . 

5. 4.9 定义向量空间 V 中的序列是关于范败|卜||的 Cauchy 序列，指的是，对任意 e > 
0,都存在正幣数 / VU ), 只要 DNUU 就有 

IU …， -/V || < e . 

s .4.10 定理设 IH 是冇限维实或复向》空间 v 上给定的范数， V 中给定的向 ft 序 
列. 则序列收敛于 V 中的一个向董,当且仅当它是关于范败 HI 的 Cauchy 序列. 

证明： 选取 V 的基3， R 考虑等价的范数 II [ J *], IU , 注意到，如果假定 V = R ” 或 C ” （” 
为某个 幣数〉 fl 假定其范数是 MU , 也不会影响证明的一般件，如果{/*，>是 Cauchy 序列， 
则对每个/=1，2•…，实数或复数的每个分 W 序列 U/*、） 也是 Cauchy 序列.由于实数或复数 
的 Cauchy 序列一定有极限，因而 • 对每个/ = 1，2，…， w , 都存在一个纯 Mo：,， 使得 lim 

容易验证 jim 这里1 = ,…， j - J 7 , 另一方面，如果存在 j •使 li m 尤…=2, 

则 || || < II J ，f, -x || - t - ! U-y V || ， 因而给定的序列是 （: auc hy 序列. □ 

(用于上述定理证明中的） 实数域 或复数域的一个基本性质是 • 一个序列是 Cauchy 序列， 
当且仅当它收敛 于某个 （实 或复） 纯《.这个性质叫做实数域和复数域的完 备性. 刚才证明了， 
对于任何向 tt 范数，完备性都可以推广到有限维实和鉍向蛾空间，遗憾的是，完备性对非有限 
维的向 M 空间不一定成立. 

S .4.11 定义具有范数|卜||的向 tt 空间 V 称为对范数 H | 是完备的，指的是关干该范数 |H 
是 Cauchy 序列的每个序列都收敛于 V 的一点. 
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练习考虑具有 M 范数 ll / ll , = f I f ( r ) I d / 的向盘空间，并且考虑由 

• 0 


/ 4 (/>= 0 , 


0 «+一+; 



去一 Ki; 


/*(”=】， 
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定义的函数._出各函数 /* 的草 ffl . 证明，{/*丨是 Cauchy 序列，何是不存在函数 /€ C [0, 
】],使得对范数 IHi , 有 lim/*=/. 

k • -、• 

利用 R ” 或 C " 上的仟意范数或’隹范数的单位球是紧集的枣实，可以引进另一种由旧范数生 
成新范数的冇效方法. 


5.4.12 定义设 /(•) 是 V - IT 或 （ T 上的准范数.函数 

f ,} ( y ) = max Re viz 

/ Cr >» I " 

称为 / 的对偶范數. 

首先说明，对偶范数足 V 上有意义的函数，这足 因为对 于每个固定的 Keyj 是 I 
的连续闲数，乂由 （5. 4.8), 集合 U •: /(.*>=1>是紧集.根据 Weierstrass 定理， Re •的极 
大值在策点 x u 6 U : /(* r ) = U 达到.如果（•足纯掀 ， R I c - | = 1,则由/的齐次性有 

max | y'x | = max rnaxRe cy > = max max Re v '( tir ) 

/ Hji-l »rt - 1 I i.i-i 

=max max Re y's = max v >, 

#• » I / is / rt m I /< I * 

所以，关于对偶范数 • 介一个有时是简便的等价定义，耶就是 

/ P ( V ) = max | y'x |. (5. 4. 12 a ) 

«后，必须说明，关于函数 /" 的对偶范數名称足 名符其 实的.函数 r (*)； d 然足 齐次的 
和正定的， w 为，如果 _ v 关0,则可以利 m /(•> 的齐次性证明 


r(.v) 




.V 


/(w 


/( y ) 


> 0. 


也 il •值得注意 的是， 即使函数 /(•> 不满足三角不等式，但是它的对偶/、•）仍恒满足 

广 （_ y + z )= max ! (y + z)x |< max [ | y 9 x |~H z'x |] 


< max \ yx \-\- max U > | = f D { y ) - f - 
因此，一个准范数的对偶范数总是范数. 

这样，采用构造其对偶范数的方法，任一准范数酊生成一个范数.这种构造法常常用于准 
范数实际上是范数的情形. 


关于对偶范数的一个简单不等式在下面的引理中给出.我们将会看到，它是 Cauchy - 
Schwarz 不等式的自然推广. 


_ 


5.4.13 引理设 /(•> 是 V=IT 或 C " 上的准范数，则 


I jylr \< f ( x ) f , \ y ), 

I . v > K / f ， (- r )/(>») 


对所冇 * r , _ v 6 V 成立. 

证明：如果 a •关 0, 则 

y'jfp ； < nu*x I yz\^ 

因而 I </ u ) 尸 (/• 山于这个不等式对 /= o 也成立，所以证明了第一个不等式. w 为 

丨 | =丨 | ，第二个不等式可由第一个不等式得到. □ 

要识別一些锻常见的向燉范数的对偶范数并不 困难. 如果 * r , v € C \ 则 H 6 lder 不等式的 
特殊情形是 

I .vlr I = | I < 2 I •V- r * max I I 2 I x > • = II >* II- II x ll»* (5 - 4 - 14 ^ 

I-1 i-l y«| 

如果），是给定的向 M . 乂如果 i 是（关于 lh II , 的） 单位向 M ， 且对使 I y 丨 = IkvIU 的某个 ，-， 
有 . r , = l ， 否 则有， =0. 那么 （5.4. 14> 中的等式 成立. 同理，如果 I 是给定的非零向域，又 
如果: y 是（关于 IMU 的 Vf - ft 向 M , 且对所有使^:^的:•有， = a / I 丨 ， 否则有乂 = 0,则 
(5. 4.4) 中的等式成立.因此， 

(IWi > D « m I ^ j |= max II 夕 II, || J*i Hi = Wyh , 

( I * y II - ] = max i y'x I = max lj v Hi II *r ||. = || y ||,. 

‘ S x ^ -1 

圆由此得出（ Ml , ML > D = Ml ,. 

如果考虑 Euclid 范数 II • || ; . 给定的非零向量 ^ 和任意向撤 *r, 则 Cauchy-Schwarz 不等式 
是指 . 

; ： y、l = | 2^*1^ II J - H ?* (5. 4. 15) 

1 

fl 当 iiyi| 2 时等式 成立. 运用上述关于 /, 和/,、范数的同样的 论证. 得知 （||、 v || 2 w = 
ll )，|| 2 . 所以 Euclid 范数是它 S 身的对偶范数. 

练习说明为什么 （5. 4 . 13>中的不等式是 Cauchy - Schwarz 不等式 （5. 1. 4) 的 推广. 

注意，对刚才讨论的三个范数（/,，/ 2 和1)中的每一个，其对偶范数的对偶是原范数.这 
不是偶然的巧合：对偶性定理 （5. 5. 14) 说明，这种情形总是成立的. 


5.4.16 定理设 HI 是 V=R •或 C ” 上的向#范数， ||.r 是它的对偶范数，又设 c >0 是给 

定的. 则 llorll = Hl > r || D 对所有成立当且仅当 H | = V ?| M | 2 . 特别是 • H | = HR 当 
且仅当 II HI 是 Euclid 范数 || *|| 2 . 

证明： 如果 HI =7 ?II • \\ 2 ,且1€7,则对任意 lev . 





反之. 如果 illl =( lhir 对某个 t > o 成立，又 * rev /， 则 （ 5 .4.】3) 给出不等式 


l!a-Hi = | x-x !< lull llxl!° = i||x|| ? , 

所以 II i || Mll^r || 2 . 如果 x 关 o . 可以利用这个不等式证明其反向不等式，因为 

— II II = |l J = max : jr' y | = max 〆 ,, 
c II y II 

= t k ifd ， k i^id * 

= jr . lfl 7^ = 11J ^ 

这里，用到了对所有 . v 关 0 有|| 3 ^| 2 /|| >> ||<1/、/7的亊实 ： （: auchy - Schwarz 不等式保证，当一 
个 Euclid 笮位向 ft 平行于一个固定的非零向 破时， 这个给定的非 零向坩 与这个单位向贵之间 

的内积的极大值会出现，因此，||1||<;||1|| 2 对所有1€\^成立.它与已证的反向不等式 

—起证明 ， IU || = VT || I || 2 对所有 V 成立，当（=1时，爵后的论断成立，并且说明 
Euclid 范数是仅有的等于自己的对偶范数. □ 

作为最后一个注释，我们要说明一种冇用的观念，在这种观念下，一个向量与一个向《范 
数一样 • 也有一个对偶. 

5.4.17 定义设是给定的向 ft , IH 是 C ” 上给定的范数，集合 

6 C * ： || >» ||° || J * || =- y'x = 1 } 

称为 I 的关于 HI 的对偶.如果: y 在 *r 的关于范数 IM 的对偶中，则向 M 的有序对（•!*， 3-)6 
c xc n 就称为关于 || HI 的对偶对. 

由推论 （5.5. 15) 可知 • 如果 IM 是向蜻范数，则每个向 M 关于 Ml 的对偶是非空 

的.它可能由一个点或多个点 组成. 例如，如果 M |-= MI 2 , 则每个向撤 * reC ” 的对偶是向 
Ml 本身.另外，如果 IH = Ihll ,则1=[0. l ] r 的对偶由一个向 M 组成， mx =[ l , i] T 
的对偶包含无限多个向爾. 

习题 

1. 注意， （5. 4.5) 可等价地叙述为 

c: ( IML 奸卜 c M ( !ML , IMI,) 

其中（：„•(•，•）*(：„(•， •） 表示与 （5. 4.5) 中的相应范数有关的可能达到的最佳常数•证 

明 C “ H !” HL ) = C m ( IN “ IN !,)*'. 

2•用 C^IMU ^)和（^(|11， I 卜 M 表示 cj | M !.， IM ,), 其中，有关的常数不 
一定是可能达到的最佳值，对（〕„做同样的表示. 
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3. 验证右边附丧给出了 L 和 L... 范数之间的最佳界 X 1 2 oo 

Cm(IMU IMP; 即 IUL 对所有 Ke 与 a , # , 一—! - t :— 

=1，2, oo 成立.在每种情形，举出一个非零向使得 j : 

2781 IU I | a = C \, 说明所给的界是可能达到的 ft 佳界. 关于 " ” 

最佳下界 II *r il^c ii * rL 的表是什么？ 提示： 参看习题 i . —1 _!_ ! _ — — 

4. 证明，如果实或复向 M 空间上的两个范数是等价的，则它们的关系可以用像 （5. 4.5) 中 
耶样的两 t 常数及一个不等式联系起来. 提示： 考虑仵 II •&的单位球 S 上的/(^) = 1/ 

II . HU 如果/在 s 上无界，则存在序列 U _ v } c : s ， 且适合 IUv IL <+ 及 IU 、. 1 = 1，这与 


HI 。 和 HI , 的等价性相 矛盾. 汴意 • 这与有限维件及紧性没有任何关系. 

5. 证明， （5. 4.2) 中的函数 /* 有 件质： 当 々一 OO 时，对每个 J •有 /( x )- o ; 当 h oo 
时 ，II J \~ J ) IL — 0;而对每个々>2,存在某个 J> 々使得对所有 ）>J 都有||/*一/, || . > k w \ 
因此，一个序列在某种意义下可能对一种范数是（逐 点） 收敛的 Ouichy 序列，而对另一种范数 
则不是 Cauchy 序列. 

6. 设 VM 完备的实或复向 i * 空间，设 U u ’>M V 中纶定的庁•列，||叫|足 V 」•.给定的范数. 


[2/9] 


如果存在 M >0, 使得 til x … || 对所有” =1，2,…成立，证明用 y “ = 定义的 

▲•I 4—1 

部分和序列收敛 pv 的•个点.这推广 r 关于实数的无穷级数的收敛件的什么定理？ 

7. 证明对每个 _reCT 有 || J * || - Imi || .r ||,. 

«• 如果《 >0 且 ||.||. 三 0 ||.||. 证明 （ IML) D = (l/ a > IMr. 

9. 证明，对任葸/>>〗• ~范数的对偶范数是~范数，这里，（/是由关系1//>+1/(/=丨定 
义的.提示： 用 H 6 ldei •不等式的一收形式代替 （5.4. m . 

10•设 ihlL 和 II - II , a c 上两个给定的范数，并 ft 假定存在某个 O 0 使得 || III 。< 
c IMI , 对所有 成立. 证明 lUKclMir 对所有* rec ” 成立. 提示： 


||.°= 


I _y > 丨= 


II .v II . 


11•证明， nr 的等距变换群总包弇 hi 的所有等距变换的伴随组成的集合.由此推出， 
II - ir 的等距变换群恰好是由 II 的等距变换的伴随组成的 集合. 什么时候 hi 与 ||- r 的等 
距变换是一样的？ 

12. 设 IMI 是 C ” 上的向最范数， R 设 T 6 M ，. 证明，如果 T 是关于|卜||的等距变换，则 

mi ?= II - r . 


13.设 HI 是 C ” 上一个给定的范数. （ a ) 说明零向 M 关于 IH 的对偶总是 {0>. ( b > 试用推 
论 （5. 5. 15) 证明，每个 jeer 的对偶是非空 集合. 提示： 如果 || > || D = 1 且 II I II ，确 
定 t 彡0使 v = cyi) 在 j 的对 偶中. （ c ) 设 mi 是 Euclid 范数||-|| 2 .证明每个 a - ee 的对偶是 
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两条线段 


的对偶是以 . ,== U ] 的对偶是从到 \iy 
，^=「2的对偶是 Ihi * r=[U 的, 


f ) 证明， ）• 在 _ r 的关于 M | 的对偶中当 R 仅 

的关于 Ihir 的对偶中. < g ) 证明，对每个 《 rec -， J 关于 IM 的对偶是当 R 仅当 Ihll :. 

14. 考虑由 /( i )= I - r , j ' 2 丨 12 给出的函数 /•• R -- R . 证明集合彳 j . : /(. r > = U 是非紧的 
这与 （5. 4.8) 矛盾吗？ 

15. 考虑 IF 文屮给出的 R 2 上的一个准范数/(^> = ( IUIL ll • rb ) l : 的例子， K 中 

II -r II . = IlClOx.^r || 

114 = II ra-,,10^] 1 II • 

证明，“申.位球 " UGIT : /( BO 在第一象咏内的部分以线段 _ r 2 = l / v / i 5. 线段 . r| = i/ v /^fi 

•-段双曲线弧为边界.试础出这个集合的草图并且证明它不是 凸集. 为什么该“中 .[• 

球”在其余 H 个象限中的余下部分可以通过这 tft 合依次对各坐标轴的反射来得到？证明，对伯 
范数的单位球 U 6 R -、 •第一讼限以纹 a n '10 十 . r := /仿和线段 . r ,+. r : / l 0- / To ^ 
边界. 而/’的 锒个单 位球可以通过 Sft 涫-免限的邰分依次迸行反射 j ! f 到，并 R 它 ft 凸*. ill 
明../⑼的单位球在第一象限内的部)>以线段々 = 1/ v / I 5 •线段 . r , = 1/ v /16 和线段 . r , +. r , 二11 

(10/而)为边界 • 该申位 球的余 T 部分可以通过这个*合依次对各坐标轴的反射来 得到. | L 它5； 
凸集.莳后把的宇位球与/的单位球作比较，证明前荇正 好足后 者的闭 凸包. 

16•设 HI 是或 C •上 的向域 范数.证明 


jur _ 

THi 


卜"山 

II x || : V ^ 


证明 cjuii < iuli x || 对所有 sev 成立,所以. 儿何常数给出每 个 范数与其对偶 
范数之间的这两个界. 

17. 设/(•)&『或 CT 上的准范数.证明 

/’’（_ y >= max Re v'.r = max | v'.r I 
/«»>«* I / <»«vi 

Re v * j ' I v ’ *r I 

- ， -JuT ^ ^ JuT ( 5 . 4 •⑻ 

关于这种想法的另一个例子可参看 （5. 6. 1) 卜面的练习. 

进一步阅读关于各种对偶范数的讨论见 [Hou 64]. —个准范数的对偶是一个范数的思 
想似乎应城于 J . Von Neumann , 他在下述文荩中讨论 f 度规函数（我们称之为向 M 范数> • 
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205-218. 这篇文章更容易从下述 Von Neumann 的著作中 找到 ： Collected Works 9 vol . A 9 ed . 
A . H . Taub , Macmillian . New York . 1962. 

5.5 向置范 数的几何性质 


向讨范数的原始几何特征是它的单位球，通过它，可以透彻理解有关范数的重要性质. 

5. 5.1 定义设 HI 是实或复向撤空间 V 上的向最范数， I 是 V 的一个点，且设 r >0 是给定 
的. 以为中心 • r 为半径的球 是集合 

B M ( nx ) = {y V ： || ^― j * II < r ). 

II - II 的 单位球 是集合 

Bw -i3 w n ； 0) = {y^ V ： lljyll < 1>. 

_ 练习证明，对每个 K >0 以及每个 o ^ V , B ( r ； s ) = { x ^- y ： B ( r ; 0)}=^十/^;0>. 

—个以任意点 j 为中心的有给定半径的球与以零点为中心的冇相同半径的球看做是一样 
的：这只要把零点平移到点就可 以了. 单位球是范数的一个几何缩影 ， W 为齐次性，单位球 
刻划了范数的特征（实际上只需要 B 的边界 h 现在我们要确定，究竞 C ” 的哪些子集可以是 
某个向《范数的申位球. 

练习闸出 R 上的/,，/ 2 和/范数的申.位球的草图 • 它们之间是否存在包含关系？哪些 
点一定在 R '’ 上 的任一 / P 范数的单位球的边界上？ W 出儿个/,范数的单位球的 草图. 

练习如果 liHL 与 H 是 向# 空间 v 上的两个范数，证明，||^*|| # <||1^对所有0*€ 
V 成立，当 M 仅当从 W 此向 时范数 的自然偏序关系可以用几何的包含关系来表示. 
当一个范数乘以一个正常数时，单位球会发生什么变化？ 

练习如果 IH 是 V 上的向 M 范数，乂如果且《是使 II aill = || 0- II 的纯 tt , 证 
明 《= o 或 UI =1，由此得出，每条“射线” { a : (1〉0>与 HI 的申位球的边界恰好相交 一次. 

5. 5.2 定义一个范数称为是多面的，是指它 的竽位 球是多 面体. 

练习哪些/,范数是多面的？ 

练习如果 HI 是多面范数，如果 seAt 是非奇异矩阵 • HU •是多面范数吗？ 

开集和闭集这些基本的拓扑槪念在具有范数的向量空间中是很容易定义的. 

5. S .3 定义设 Ml 是实或 S 向讨空间 V 上的范数， S 是 V 的子集，点称为 S 的内点， 
是指存在 e >0 使 dCS . 集合 S 称为 开集， 是指 S 的每点都是 S 的内点 ； S 称为 闭集， 
是指它的补集是 幵集. S 的 极限点 是这样一个点它对某个序列 /*、 C ： S , (关于 HI ) 有 
\ imx a ) = x . S 的 闭包是 S 与它的极限点集合的并集. S 的边界是 S 的闭包与 S 的补集的闭包 
[282] 的交. 集合 S 是有界的，指的是，存在某个 M >0， 使得 SCBh ( M ; 0)，集合 S 是紧的，如 
果可以从毎个用开集作成的复盖 UA .3 S 中选出有限多个集合 s 。，， …， S 。、 使得 Ld \3 S . 
练习证明任意实或复向董空间 V 上的任何范数的单位球 B .. 是有界闭集. 

练习设 V 是有限维实或复向堵空间， SCV 是有界闭集.利用对某个 n 有 V 同构于 R ” 
或 CT 的事实（见附录 E > 证明 S 是紧集. 
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5. 5.4 论断 如果 HI 是非平凡（即非零维）的实或复向量空间 V 上的向量范数，则0是单位 
球的内点.这可由范数 IH 的齐次性及正定性得到，它蕴涵 + ; 0) 匚 By (】； 0); 
且前者的边界处在后者的内部. 

S . S.S 论断 向鼠范数的单位球是均 衡的； 也就是说，如果 O ' 在这个单位球中，则对适合 
I a I =1的所有纯最•也在该单位球中.这一结论可由向最范数的齐次性得到. 

5. 5.6 论断 有限维向 M 空间上的向童范数的单位球是紧集，因为向董范数的齐次性它是有界 
的；因为范数总是连续函数，它又是 闭的. 在有限维情形，有界闭集是紧集，但在无维情形， 
有界闭集不总是紧的.要经常用到的紧集性质是 Wei erstrass 定理（附录 E >: 紧集上的连续实 
值函数是有界的；并且在该集上达到它的上确界和下 确界. 因为这个理由，我们经常提及这种 
函数的“极大值”和“极小值”. 

练习考虑由具有可数多个分最的向憧组成的复向 ft 空间/ 2 ,它的范数是有限范 
数的自然推广 

|| ^ ii 2 = ( 2 I ^ n , 2 . 

卜雇 

证明，对每对不同的单位基向擞 G 和匕，），々=丨，2 ,…， W II || 2 =>/2. W 此 U *} 

的任何无穷子序列不可能是 Cauchy 序列， 所以不可能冇任何收敛的子 序列. 由此可知/ 2 的单 
位球不可能是紧集. 

5. 5.7 论断 向域范数的单位球是凸*. 

证明： 如果 || 之 ||<1 ， ||^||<1. 且 1], 则 

II or -+• (1 —a)y || < II or || + II (\—a)y II = a II J- II + (1 一 || 夕 || < a + (1 一 a) < 1 ， 
所以也位于单位球中. □ 

上述关于范数的单位球的这些必要条件也是刻划范数特征的充分条件. 

5. S .8 定理有限维实或复向 M 空间中的集合 B 是 V 上一个向请范数的单位球，当且仅当衫 
是： （ i >紧集， （ li > 凸集 ， （Hi >均衡集， （ Iv ) 以 O 作为内点. 

证明： 我们已经得知条件 （i ) 〜（ IV )是必要的，为了看出它们对范数定义是充分的，考虑 
任意非零点 ■ rev , 作从原点到 a ■的-.条射线线段 { aJ •: 0< a < l >, 在这条射线上，用原点到单 
位球的边界上的唯一一点间的线段 K 度作为一个单位.于是 . r 的“长度”定义为沿该射线从原点 
到 I 的比例距离，更形式地，定义 || a : ||为： 

f || J ： II =0，如果 *r = 0, 

I II -r II = min | + 且 ix € B 卜如果 《 r #0. 

这个函数是有意义的，有限的，且对每个非零向•是正的，这是因为 S 是紧集， H .0 是 B 
的 内点. 利用均衡性假设容易看出 | 卜 || 是齐次函数，所以，余下只需验证三角不等式.如果了与 
夕是给定的非零向量，则 • r /|| i || 与 y 是 B 的边界上的单位 向最. 由凸性，向童 


y 
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也—定在 B 中. W 此，|| 2 ||<1,且易算出，这等价于11了 + 3^<1|1|1 + 11夕11. 

练习给出（5.5.8>的证明 细节， 仔细注意四个假设中的每一个各用在 何处. 

我们熟悉的所有 G 向《范数都有这样的性质，那就是 II I || 只依赖于 * r 的各元的绝对值， 
|284] 此外. 每个/,范数足 o * 的各元的绝对值的递增函数 • 这两个性质不是没有关系的 • 

5.5.9 定义如果丄 =[>] er ( ir 或 c ")， 定义 U I =[ U , I ]• 我们说 I 了丨 < 丨 y 丨•是 
指丨 . r , 丨 < 丨 ： y , 丨对所有/=1，2•…，/!成立 • F " 上的向童范数 IH 称为 
( a ) 单 调的. 指的是对所有 v 6 F . | 1 |< 171 蕴涵 1 卜!'||<||.“》 

( b > 绝对的•指的是对所有有 || x || = || U | || . 

5.5.10 定理 r ( ir 或 cr > 上的范数 IH 是单调的当且仅当它是绝对的. 

证明： 如 * II • II 是申凋的，旦 • r 6 F . 设），=丨 I I • 于是 lylglil , 且 | i |< 
I 7 I ,所以 II ^ II < II x || M IU || < || ^ II ,因此卜||是绝对的.如果 II • II 是绝对的，设 
. r =[，」6 r 是绐定的向 tt , 设々是给定的幣数 . R 乂设 a e [0, 1]. 则 

II [ j*i •…， j * I . oj *” jvi ，…， j\] r I ! 

= y ( I — a )[ j '\ ，… . J * I ，- J ** I + 士 (1 - a >. r + or I 

< -|-(1 — a) || [j'i ，…， :* 丨， —J-t.J't-i . —•.r.] T !| f y(l ~ o) || .r || -fa || .r || 

=y (1 — a) !l .r li + y ( 1 — a '• ： l .r || t a H J II = ji J* il . (5.5.11) 

范数绝对的这一假设条 ft 只用 汴倒 数第二 t 等式中.对各不相同的分复应用 （5. 5. 11), 
ni 以证明绝对范数有 性质： 对每个 jfr 及 0 4 6 [ 0 , 1] 的所有选择， / r = l , …，… 

II i ， … •W-] 7 || < II i •… .I”] 7 II • (5.5.12) 

M 后 •• 如果 I .r 丨 < 丨 .v 丨 ， 则对每个々 =1, 2, •••• ", 存在实数❼和乂，且 a *e[0, 1 ], 使 
.O 于是，利用绝对性便有 • 

II ^ (i = II r a, v, . ― .a^ ，{， ->\ 1 ll = ll Toi I y\ I ，…， a- I % I ] 7 II 

< II [I .Vi 丨 •… ，丨 .V, i] T II = II .V |l ， 

所以这个范数一定是单调的. □ 

不等式 （5. 5. 11>启发我们提出稍弱的单调性槪念. 

_ S .5. I 3 定义 F ( R ' 或 C 1 上的向诂范数|卜||称为弱单调的，是指 

II [>| •…•心 I ,0 ， 1…•…，,| < II .r* i ，••••，-]’ II 

对所有 . r 6 F " 及所冇々=丨，2,…，成立 • 

如果范数 IH 是弱单调的，乂如果《€[0, 1]，则 

II [-^ 1 ， … ， A. 1 .or* fjr kn ， … •J\] T || 

=II (1 — a )[^ i ，…， j * h ，0，心，，•…， . r .] 7 * H - aJ - II 

< (1 — a) I! [.r , ，…， j* i ，…， J\] r || + a || j- || 

<(1 — a) II x il f a |j .r || = || j || , 
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所以弱单调范数满足较强的条件 （5. 5. 12〉.因此，如果在弱单调范数的单位球面上给定一点， 
a 该点的一个坐标变到零，则这样产生的整个线段一定在单位球内.单调范数显然是弱单调 
的，但是，反之不成立，这正是下面的练习要证明的. 

练习证明顶点在士「2, 2] T 与士 [1, 一 1] T 的平行四边形是 R 2 上的一个向最范数的单位 
球，且这个范数不是弱单调的. 

练习函数 /(* r )= 丨 a 丨十丨 * r 2 丨是 R 2 上的向 M 范数吗？它是单调的吗？它是弱单 
调的吗？両出它的单位球的草图. 

练习设 HI 是 R 1 ’ 上的绝对范数，证明，如果1=0,,乃尸是单位球边界上一点，则 
[士士々] 7 (所有四种可能的选择>都在边 界上. 举例并闽出上的 一个祀 绝对向 M 范数的 
单位球的草图，说明它的几何性质.在 R _ 中会出现什么情形？ 

练习 W 出 R 2 中顶点在士 [0, 1] T , ±[1. 0] 7 ■和土 [1, l ] f 的多边形的眾 W . 说明它为 
什么是 R " 上的一个弱单调向《范数的中位球，而不是单调或绝对向 M 范数 的中位 球. 

向 械范数 的单位球的凸件具有许多往往是令人惊叹的深刻结论.其中之一是下面的对偶性 
定理，我们一般从准范数的角度来叙述它.所涉及的基本思想是很 fl 然的几何思想，也就是 
说，包食某个集合5的锒小闭凸集 （ 闭凸包 Cos ; 见附录是包含 S 的所有闭半空间<在超平 
面一边的所有点）的交，并且，如果存在这样一点 I ,只要 S 位于一个半空间内， * r 也就位于 
这同一个中•空间内，则〃必 定域于 S 的闭 凸包. 这些简单的概念直接导出一个里要结论，一个 [2861 
向嫩范数的两次对偶等于原范数. 

5. 5.14 定理（对偶性定理）设/<0是\^=『或 C ” 上的准范数，设 /" 表示/的对偶范数，而 
/%是/«的对偶范数•乂设 

\ v ： fu) ^ l}. 

/r s u e v ： / w (x) <n 

分別表示 / 的“单位球”和产°的单位球.则 

S c iT = Co B， 

因而/°°(^></(了）对所冇 成立. 如果/是 v 上的向量范数，则 
证明：设畏给定的向麼 • 则 （5. 4. 13) 说明，对任意: v € V , 

I ： y：r \ 

_ 

f 0,, ( x ) = max I y ' j ： max /(j >/’’( v ) = /(j ). 

因此， / w ( hb / u ) 对所有成立，这个不等式等价于几何命题 BciT . 

为了证明第二个包含关系，采用对偶范数的特征 （5. 4. 18) 是方便的，还应知道集合 
V : 是包含原点一般闭半 空间. 利用对偶的范数的定义，设“€故'是给定的点，我 

们看出， 

« € {卜1^/、<1，对每个适合产( 1 ；)<1的 m 

= {/：Re 1，对每个适合 f ( xv ) < ] 的 u ； 的每个适合 Re iTzt ，< 1的 v } 

= { / ： Re / * x ; < 1，对所有 u - e /3的每个适合 Re v ^ I 6 <J v ) 
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这说明《位于包含 B 的各个点的每个闭半空间中：即《位于每个包含 B 的闭半空间中.因 
为所有这些闭半空间的交是 b 的闭凸包 c:o 得知 M 6Cob . 然而点是任意的，所以 
/ fCCo /3, 因为 CoS 是包含 B 的所有凸集的交，我们也有 CoBCiT , 因而 iT = C 0 B . 

如果准范数/实际上是范数，则它的闭单位球 B 是凸集，因而 B = CoB ， 所以 BCZITC ： 
12871 B ； 因而因为它们的单位球是恒等的，所以范数/与/°°相同. □ 

对偶性定理的一个应用是下述有用的结果.它是泛函分析中的一个重要的一般结果（称之 
为 Hahn - Banach 定理）关于有限维形式的特殊情形. 

S .5.1 S 推论设•是给定的向燉， Ml 是 c •上给定的向录范数，则存在向量 >ecr 
使得 

( a ) I (： y a )i 丨 < IU1I 对所有 16C " 成立； 

( b ) ( y 0 ) a y = II .v || . 

向极 > 不一定唯一，不过 ll ： y。|| D -1 且 （： y 。〉 •: y = || ^ II . 

证明： 我们知道，根据对偶性定理， 

II y II = < II «y || D ) D = max \ y a z \, 

并且由向 ft 范数 II - ll D 的单位球面的紧性可知，该极大值实际上可由某个（不一定唯一的）适合 
ir = i 的 o 达到，因而 II ：y II = | y % | • 用模为1的适当因子乘 > 便知，可以使内 
积夕>0为正值， W 而 （ b > 已被证明. 一般 • 从 （5.4. 13>可知，对所有有 

I lunu = ii xii . 

因此向皺> 同样适合 （ a ). 注意， （ a ) 说明||> 而 （ h > 使 || ： y 。|| D = 1 . □ 

习题 

1 . 证明，集合 S 是闭的，当且仅当它包含它的所有极限点. 

2 - 证明， S 的每一点是 S 的极限点，因而 S 的闭包恰好是由 S 的极限点组成的 集合. 

3. 给出一个既是开集乂 是闭* 的集合 例子. 给出一个既不是开集乂不是闭集的集合 例子. 

4. 设 S 是具有范数||叫|的实或复向块空间 V 中的紧集.证明 S 是有界 闭集. 如果是 
给定的无穷序列，证明，存在一个可数子 序列彳 j ". iCIIjr .} 和一点 《 r6S ， 使得证明 
紧集的任意闭子集是紧集. 

5. 在（5.5.4)中，如果 V 是零维的，会出现什么情形？ 

6 - 如何定义向 ft 半范数的单位球，它的形状与范数的单位球有何不同？ _出一个例子的 
[2881 草图. 

7. 如果 IIHL 和 IH 〃 是一个向 M 空间上的向 M 范数，又如果 IIHI 是用 

II || = max { || x || a , || xll ^,} 

定义的向 1 * 范数，证明 =B . a C \ B,. lr 

8 . 证明， r ( ir 或 C ”） 上的向墩范数 | h || 是绝对的，当且仅当 

II [a, ,a 2 J*z *•-.a^x,] 7 || = II Lxi .x 2 , —,x w ] T || 

对所有 O 丨， x 2 ， …， x n Ye ¥ n 和所有适合 丨⑴丨 =^..= I an I = 1 的纯童幻， fl 2 ， …， a . 6F 
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成立. 

在以下六个题中，要用到下述记号，设: y 6 V , 设 Ml 是实或复向贵空间 V 上的向童 
范数.则 


1.iT 9 y) = iz(t) = x + /(^ — 1} 

表示 j •与 y 间的普通（线性 代数） 线段 ， a 

IMI ) = { 2 6 : II j * — Z II -f \l Z — y \\ = II x ~ 3 * II } 

表示关于范数 IH 的 * r 和: y 的（度 M ) 凸包. 

9. 证明 U ^ r , y ) CZCU , v ; IH ) 对所有3七7和任何向 M 范数 HI 成立. 

10. 如果 V ^ C ”， 且其范数是/ 2 范数，证明 C (* r ，： y ; ||-|| 2 ) = /-( x , : y ) 对所有* r ， y^C 

成立；即证明 ，II J - -f ^ 112 = II X— Z \\ 2 II z — y \\ 当 R 仅当 Z = — 对某个 /€ 

[0， 1] 成立. 

11. 证明 C ( J •，力 HI ) 总是一个普通 凸集； 即证明，如果: r ,， z 2 ec ：( s 9 y ; IMI ), 则 
tzi /)? 2 6 C ( x . yi M • II ) 对所有 f €[0, 1) 成立. 

12. 考虑 R 上的 V = R 2 , 证明 C((U 0>, (0, 1>; Ml ,) 是平面中顶点在点 （0, 0)， 
(0，1)，（1，1) 和 （1， 0> 的幣个正 方形. 提示：证明 （0, 0> 和 （1, 1) 在 （0, 1) 和（1， 0) 的 
/• 凸包中，然后利用习题 11. 另外证明 C ((1, 0>， （0, 1>; IhIU ) 恰好是线段 L ((1, 0), 
( 0 , 1 )). 

13. 冉考虑 R 上的 V = R 2 , 证明 C (( l , 1>, (1， -1), HL ) 是平面中顶点（0, 0), (1, 
1)，（2, 0) 和（1，一 1) 的 粮个正方形. 提示：证明 （0, 0) 和 （2, 0) 在（1， 1) 和（1， 一1) 的 I 
凸包中.另外证明 C (( l , 1>, (1, -1)： |卜||,)恰好是线段 U ( l , 1>, (1, 一 1”. 

14. 有々（>2)个点的点组的度铖凸包可以定义为 所有这 样一些的点组成的集 
合，使得 z 在两个点的度时凸包中，而这两个点中的每一点乂在 S 的某一对点的度嫩凸包屮. 
证明，当々= 2时，这与上述定义是-致的，描述 IT 中的一组标准正交基向 fth , g ， …， 
匕>的/,凸包.这个基的/ 2 凸包是什么？这个基的荮通线性代数凸包是什么？ 

进一步阅读 关于向 W 范数的几何特性的进一步讨论见 [Hon 64]. Von Neumann 在 （5. 4) 
节末引用的文争中采用 r 证明对偶性定理的关键思想（一个范数或准范数的单位球等同于所冇 

包含该范数或准范数的单位球的所有半空间之 交）. 关于凸集，凸包，半空间等等的详细讨论 
见 [ Val ]. 

5.6 矩阵范数 

W 为 M " 本身是" 2 维向 M 空间，所以可以采用 C "' 上的任一种向 M 范数来度量矩阵的“大 
小”. 但是，不仅仅是高维向裰 空间； 它还有通常的乘法 运算. 并且在度 M 矩阵的“大小’， 
时，建立起的“大小”与 A 和 B 的“大小”间的关系常常是有 用的. 

我们称函数 IN f : M”~-R 是矩阵范教，指的是，对所有 A , B 6 M n , 它满足 T 列五条 
公理： 



206 


第 5 章 


(1) ||- A ：|>0, 非负性： 

( la ) fAl - O , 与且仅当 A = 0, 正定性： 

(2) '| = U | 对所有 S 纯 ttr 成立， 齐次性： 

(3) ；； A + HKi-.A :+ ； 2 i !|, 三角不 等式; 

(4) iMBi | i < i : A f |H I ，. 次乘性. 


注意，性质 （丨） 〜 （3) 与向 M 范数 （5. 1. 1>的公理相同.关于矩阵的向 ft 范数，即满足（ I )〜 （3) 
Ifii 不一定满足 （4) 的闲数，称为广义矩阵范教.矩阵半范数和广义矩阵半范数的槪念也可以通 
过取消公理 （ la ) 来定义. 

对任意矩阵范数仏 | .*V l^AA '<fAi ■: A = . 所以对适合 A 2 =A 的任意非零矩阵 

A. …定仃 A M. 特別是 / :> 】对任何矩阵范数成立.如果 A 是可逆矩阵 ， Wl l = AA \ 
Wlfij. , /.\ 1 • IL 打下界 

_ 它对任何矩阵范数|! • !〖都成立. 

练习证明，如果叫是矩阵范数， ㈣ 〖 AS ]!# Af 对每个务=1, 2,…和所有成 
立.给出一个为子 • 使得这个不等式对关于矩阵的向 M 范数不成立. 

当把〈<;(5.2>屮引逬的铲夂问畎范数应用于向址空问 Mn 时，它们就是矩阵范数，而有些 
向《范数则不是矩阵 范数. 泌熟％的例 f 是/ *=1, 2. ^时的/,范数，已经知道它们是向 M 范 
数，所以 R 0 S 翌验证公理 （ U . 

例对声€^，用 

II A II , ^ | 

定义的/,范数是矩阵范数，泫焙囚为 

|| III = 21 土 …〜| < 土 I “ a I 

^ I *• I • 小秦 ， j 

< S 1 a * h - 1 = ( 公 » «- ! )( 2 I 〜 I ) 

| I / .M - 1 

- Mih imh . 

第一个不等式珂以从 7 角不等式得到 • 而第二个不等式是把一些附加项加到和中得来的. 

例对/•用 

MIU 三 （E I 2 广 . 

定义的 Euclid 范数或4范数是矩阵范数，这是 is 为 

li 糾 S|S^r< S(S I:)(S I 〜 I 2 ) 

卜 ，， 1 < - ! 1 会一 I 蝎 ， 1 
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= (E 0( S P ) = miihbii !. 

«1 I 

这个不等式正是 Cauchy - Schwarz 不 等式. 当应用于矩阵时，这个范数有时称为 Frobenius 范 
数， Scluir 范教或 Hilbert - Schmidt 范数.如果用 A6M , 的列向 M16C ” 表示 A = [>,〜 •••'] 
eR , 则 

II A ||? = IU, ||? + …十 IU II?. 

因为 C " 上的/ 2 范数是两不变的，我们有®要的奉实： (M 

II UA 111 - II II! + …+ IKAu ||! = IU, II? + …+ II 〜 II! = II A III , 

其中是任意两矩阵.因为||« 1 2 =||衫||:对所有谷€^/„成立，这蕴涵 

II L/AVil, - || A VII ： = I! VVV || 2 = || A- || 2 = || A|| 2 , 

其中 U , 是任意两矩阵. W 此，上的/ 2 范数是丙不变矩阵范数. 

例对，用 

II A || . = max I | 

K It/% M 

定义的范数是向 《 空间 m _ 上的范数，但不是矩阵范数.考虑矩阵 j = D |] eM ,, 由计 


算可知 ，尸 =2 J , || J iu . = 1, II J 2 II = II 2 J II =2 11 J iu =2. 它不适合 || 尸 iu < |U II ?, 
因而不是次乘性范数.但是,如果定义 


则有 


|| .A |[ = W II A II ./A € M ,. 


鳄 n 

;| AB I 一 w ( max | | < n max | | 

w 

< n max ^ || A ||.., || B \\.„ = n || A ||.^w || B ||,„ 

里 ‘“,、"*- 1 

W 此，只需要对向 tt 范数 HI . 作稍许改动就可以使它成为矩阵范数. 

与 C ” 上的每个向 M 范数 IH 相关联的矩阵范数！ •!] A 然是由 M ,, 上的 || “诱导”的矩阵 
范数. 该范数:卜1|是由1卜11构造出 来的. 而这种构造法也是从一种范数产生另一种范数的 
方法. 


5.6.1 定义设 II • II 是 C " 上的向 M 范数. 定义 m b 上的卜；!;为 

i A 4 = max || Ar || . 

< x f ^ 1 

上述定义中取 “ max ”（ iW 不是 “ sup ”} 是合理的，这是 W 为 || A_r || 是 _ r 的连续函数且 申位球 
B || -1| 是紧集（见附录 E ). 

练习证明范数 （5.6. 1) 也可以用下述等价方式来计算： 

| Aj = max || Ar II = max || Ar || . 

1 • k - l • r I! 〜 I 
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II Ar II 

TTT 


，其中 II - II . 是任意向 M 范数 


5. 6.2 定理 （5.6. 1>中定义的函数 H [; 是上的矩阵范数，||八1||<||八||1||1||对所有八€ 
M „ 和所有成立，且|7|||=1. 

证明因为 l || A ||| 是非负值函数的极大值，所以本节开头所述公理 （1) 成立，又 A:r = 0 对所 


有成立仅当 A ==0 时才成立，所以公理 （ la ) 成立.由计算可知， 

il cA l|j = max || cAx || = max | c \ II Ar || = I c | max || Ar || = \ c \ ||| A |||, 
由此推出公理 （2> 成立.类似地，三角不等式 （3) 被继承下来，这是因为 

\\ A-b B !||= max || ( A + H)x || = max || Ar + Rr || < max ( || Ar || -f || Bx || ) 


< max || Ar || + max II Hr || = ||| A !| +1|| B ||. 

次乘性公理 （4> 可从下述事实 得出： • 

If AB | = mAX II ABr || 一 II ABx H 11 Rr || 

|| max |U|| - max ,, ^ „ -JJT 

^ max max ■\~]f = I A 11 B II ， 

这里，不妨假定极大值只取遍那些不在 B 的零空间的 a *. 对于下一个论断，因为范数 ,| hf || 是以 
取极大值的方式来定义的，由此得知，如果1^0,则 || Ar /||* r || || <|| A |||. 由向掛范数的齐 
次性可知， I ! Aar || <| A ||| || x || ,当 *r = 0 时，不等式也成立. M 后 


II / 1 = max || lx || = max || x || = 1. 

I ^ * •■l I xl -I 


□ 


S .6.3 定义我们称 （5.6. 中定义的矩阵范数1|叫[是由向烺范数 M | 诱导的矩阵 范数. 有时 

称它为算 子范數 或与向 设范数 HI 相关联的小上界）范数. 

注意，算子范数是矩阵范数 SI 以作为所 有向* 范数的一般性质的推论. 因此， 一种证明 
上的某个函数是矩阵范数的方法是，证明它是由某个向 M 范数所诱 导的. 当讨论称之为» 
范数的重要矩阵范数时，将采用这种方法. 

定理 （5. 6. 2) 中所述不等式说明，向馕范数 HI 与所诱导的矩阵范数 I .11 是 相容的 ，因而 
这个定理说明了，相应于 CT 上的任一向 S 范数，都存在上的一个相容矩阵范数.该定理 
也给出了矩阵范数 L • I 是由某个向鼠范数诱导的必要 条件 ： I / ||!= 1,遗憾的是，这个必要条件 
并不是充分的. 

下面，介绍几个重要的矩阵范数的例子，它们是由熟知的/,范数诱导的，不过，不借助 
定义 （5.6. 1>也可以计算 出来. 在以下每种情形，取 

5.6.4 极大列和矩阵范数! H |, 在紙 上定义为 


m 

i 1 A ll = maxD I 〜 |. 

范数 l || • III ，是由 /, 向量范数诱导的，因而它一定是矩阵 范数. 可以把这一事实证明 如下. 用 A 
的各列把写成 八二 )]〜…〜]. 于是 | A |:, = max || a. ||卜如果： r = [j ,〕， 则 
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國注意，如果今 = h •且^#0,则 _ r 7 V Ar — || Ar || 卜 A IU ||?，所以 A >0 且71是非负实数. 

练习如果13是正规矩阵 ， a i 3 = VAV , 其中， U 是西矩阵，且八二出叫以，，…， A ,,)， 

证明 

I - r'Hr |<maxn A |:义是8的特征值> || x |||. 

练习证明 II / VrllisjWAi •对所有 J 成立，然后利用上一个练习证明，|1|叫| 2 是由 

Euclid 向域范数 H | 2 诱导 的矩阵范数.由此得出谱范数实际上是矩阵范数. 

练习证明 :2 = i At 对任意和任意丙矩阵 L ；， 成立.因此：谱范数 
是两不变矩阵范数. 

下面证明，经一个冏定的相似，一个矩阵范数可以变换成另一个矩阵范数. 

5. 6.7 定理 如果 H || 是的矩阵范数， RSeM M 是非奇异矩阵，则对所有 AeM , 

i |! A | s = i ： S '.AS 

是矩阵范数. 

证明： 可直接验证， 1!. L 适合公理（1>, ( la ). (2> 和（3)， lii • ||| s 的次乘性可通过下面的 
计算 得出： 

III AB I . = | S | = |||( S _ 'ASKS »aS)!|! <||SMS| |：S •> 7 iS ||| = | A || ts !|j/i ||| s . 口 

为使矩阵范数适合 特殊离 要，定埋 （5.6.7) 可能很 有用. 这种形式的某些应用将在这里和 
— 节阐述. 

矩阵范数的一个®要用途就是给出矩阵的 ig 的范 IH . 


5. 6.8 定义矩阵 .46 M” 的请 半径〆 

p ( A ) = max{ U I: A 是 A 的特征值}. 

由此可知.如果 A 是 A 的任一特征值，则 UlgyAh 此外，至少有一个特征值 A 可使 | A 丨 =• 

j _^0, U U I = p ( A ), 考虑其所有列都等于特征向 M*r 的矩阵 X6M,,， 
296] 并注鹿到如果 卜1 是任意矩阵范数，则 

U U|X;| = SAXl = jAX 1^|A!|| ||!X：|, 

因此 U I 这便证明了下述定理. 

5. 6.9 定理如果;|卜 II 是任意矩阵范数， fl A6M,, 则〆 

练习试给出一个例子，使矩阵1：的向社范数 Ml 和矩阵 -A6M., 适合 MilK ^A). 

练习设 iH 是 M” t 的矩阵范数，考虑映射 F: cr - M w ， 它定义为… 

At 中其所有列正好都是 j 的 矩阵. 试证用 II j . Ii _ F(.r> : 定义的 C” 上的函数 H| 是 C’ 1 上的 
范数，并且证明，对所有和所有有 liAi 这个不等式说明，向 

量范数 HI 与矩阵范数!:•〗是相容的，而这个练习说明， A1 上的任意矩阵范数在 C" 上有一个 
相容向 M 范数. 

虽然谱半杼闲数本身不是上的矩阵或向檄范数（见习题】9)，但是，对每个固定的 
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M ，,、 它是关 f .4 的所有矩阵范数的值 的最大 下界. 

5.6.10 引理设且 e >0 是给定的.则至少存在一个矩阵范数||卜|使得 〆 A><lA |!< 
pi A ) + e . 

证明： 根据 SchurH 角化定理 （2.3. IK 存在 两矩阵 I ； 和上- 角矩阵△使得 A = L /. 
令 D , 三 diag </， / 2 , r 3 , 由计算可知， 

a , r l 山: r ? J l3 - /〜】/ 

o A, r 'd :i - / ^~d 2n 

D^D,*= ° ° ^ … n 


1 丸 

t 'dn … 



t … 

t H，2 d, n 

0 

巍 

A« … 

■ • • A 

t 

a 

零 

0 

■ 

0 … 

n” 

0 

0 0 

An 


W 此，对足够大的 /〉0, nf 以确信， D , AD / 的所有非对角元的绝对值的和小于 e . 特別是， 
我们可以 tt 定 v 对足够大的/有 | D , AD , 这样，如果定义矩阵范数 :| j . I 为 

!| B I = | D,W BUD , ' i = SJO / D , 1 > l B ( UD , ') J |,, 

其中 B 6/ vt 为任意矩阵 • 乂如果选择足够大的 /• 则可以构造出适合:的矩阵范 
数. W 为 ||| A ||!> y >( A > 对任何矩阵范数 成立. 我们完成了证明. □ 

练习说明为什么上述结果证明 7>(.4> = inf{jAf : I . | 是矩阵范数 L 
我们的兴趣在于刻划当时 A *-0 的矩阵 A , T 述结果是 符手解 决这个问题的 最后一 
个工具 • 
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SU 1 引理设 AeiVt 是绐定的 S •: 阵. 6 D 果存存:矩阵范数 it . S 使得则 
即当 々- oc 时 a * 的所有元都 e 于零. 

证明： 如果!||/\|<1，则当々一 CO 时有 |< i !|. A . f -0. 这说明 • 关于范数 1 HI , A *— 0, 

但是. W 为 V 维空间 M , •上的所有向械范数是等价的，所以，乂于向 M 范数 1.1. ,—定也有 

A 、0. □ 

练习试绐一个例子 • 使矩阵 A 和 Si •阵范数 H : f 适合! | A || L <1 和 IMIlpi . 其结 

论是什么？ 

适合 = 0 的矩阵称为收敛的 • 汴在许多应用巾，例如 • 在迭代过程的分 
析中，这样的矩阵是很有 用的. 《此，重要的是能刻划收敛的 矩阵. 


5.6.12 定理设 AeM ”. 则 lim A * = 0 SR 仅当 〆 A ><1. 

证明： 如果 A *— 0，又 * r 參0是适合的向佾，則仅当 U I <] 吋才有 — 
0 - w 为 U 丨<1 对 A 的每个特征值一定成立，得出 〆 AX 1. 反过来，如果 〆 A )<1， 则根 
据引理 （5.6. 10>， 存在 某个矩阵范数使得 j A ;<1. 因此由引理 （5. 6.1〗 ） 可知， 当 oo 时 
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线习考虎矩阵 a= [ U q 2 .对* = 2，3，…，直接计算 A * = 

[2981 Lp ( A ) y . 当 A — co 时，下列各种情形如何变化？ A * 的 各元；|| A * I , ； II A * H ； ||| AV | 2 . 

练习设 A =「 ^ 2 n H 且用递归式走=0, 1，…，定义由向量{，>} 

L -1/8 1/2」 

€ C 2 组成的序列.证明，不论第一个向 M > r ( Q > 如何选杼，当00时^ 0. 

有时，我们需要知道当时，关于 A 4 的各元的大小的界.一个有用的界是前一个定 
理的直接推论. 

5.6. 13推论设是给定的矩阵， e >0 是给定 的数. 则存在常数 C = C ( A ， e ) ，使得 

I (A* 、 \^C(p(A)^e) k 
对所有々 = 1， 2, 3，…和所有“ ）= 1, 2, 3,…， 成立. 

证明： 因为矩阵 A =[ p ( A )+ e ： rA 的谱半径严格小于1，所以 A 收敛，因而当 A — oo 时 
々一 0. 特別是，序列的各元有界，于是存在某个固定的 C 〉0, 使得丨 （ A 、 | < C 对所 
有々 = 1，2, 3,…和所有/, ) = 1, 2,…，71 成立. 这就是所要确定 的界. □ 

练习设八=[^ 直接计算 V ,说明在 （5.6.13) 中不能总取 € — 0. 

当々一 oo 时，虽然不能像 〆 A )* 那样确切地说出 A * 的各元的变化悄况，然而，对任意矩 
阵范数 I .11，序列<||| A *|||} 的确具有下述渐近性质 • 

S .6.14 推论设 H | 是 M ■上的矩阵范数.则对所有 AeM „, 有 

p(A) = limljA* ir. 

4- 

证明：因为 〆 所以，对所有 灸=1，2 •…，有 〆 A ><|| A || r . 如果 
e >0 是给定的，则矩阵叉 =|>( A >+ e ] 的请半径严格小于1,因而叉收敛.因此，当 
oo 时 p !||—0, 且存在某个 N =/ V ( e , A ), 使得 p *||< l 对所有々彡/ V 成立. 这正好说明，对 
所有 k > N ， 有 || A ” Kl >( A )+ e ]* 或 WjT < VA )+ € . B 为 〆 对所有走成立， 
HH ] 乂因为 e 〉0 是任意的，由此得存在且等于 〆 A ). □ 

正像处理向#的无穷序列或无穷级数那样，也可以用向量范数处理有关矩阵的无穷序列或 
无穷级数的收敛性问题. 

绦习设彳是给定的矩阵无穷 序列. 证明，如果在 M „ 上存在向 M 范数 HI 使得 

°° oo 

数值级数 D II A * II 收敛（以致它的部分和有界），则级数 2^* 收敛于中的某个矩阵•提 

示： 证明其部分和构成一个 Cauchy 序列. '° 

关于矩阵的一种特殊情形是矩阵的幂级数情形 • 这在研究向*的无穷级数时没有出现.但 
是，因为矩阵范数的次乘性质，容易给出关于矩阵幂级数收敛性的简单的充分条件. 

oo 

S . 6. 15定理设是无穷级数，如果存在上的矩阵范数 | • ||使得数值级数 

卜0 
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S | I ||| aIP 收敛，或者这个级数的部分和有界，则级数收敛. 

练习证明 （5. 6. 15>. 

OO CO 

练习用例子说明，有可能级数收敛，而级数 D 丨 A 丨||| A If 发散. 这类似于数 

裊 *^0 *=>0 

值级数的条件收敛（收敛而不绝对收 敛〉. 

练习设函数 /(Z ) 是用幂级数 /( z > = 定义的，它有收敛半径尺>0,且设 II * 1是 

卜0 

•3M 

H, 上的矩阵 范数. 证明 /M> 三2〜 A * 对所有适合|<尺的 AeM „ 有定义，更一般地， 

*-0 

证明 / ( A > 对所有适合 〆 A >< i ? 的 AeM ， 有定义. 

练习如果 A 是可对角化的 ， KA = S ~ l AS , 有时定义 /( A)=S l fCA ) S , 其中 f ( A ) = 
diag (/( A ,), /( A 2 〉 ，…，证明，如果 A 是可对角化的，则 /( A ) 的这个定义与上一个 
练习中的薄级数定义是一致的.在这两个定义中，哪一个比较通用？ 

练习证明用幂级数 

^ = S 

给出的矩阵指数函数对每个 A 6 M ， 都有定义. 

练习应如何定义 cos ( A )? 这对什么样的 A 有定义？ 

5.6.16 推论设矩阵 A 6 M ，， 如果存在矩阵范数 | H ! 使得 ! |:f — A |||< l , 则 A 是可逆矩阵，且 

a - 1 = 2 (/ - A) * - 

身 -0 

证明： 如果 |/- A ||<1, 则 W 为级数的收敛半径是1,所以 

g (/ - 

收敛于某个矩阵 C 但是. 因为 / V — OO 时， 

.、• N 

一 A) 4 = [，一 U — = /-(/-A) N+， — /, 

*■0 

所以，得 rt : C=A l . □ 

缠习 ia ： 明上述结果等价于下述 命题： 如果 Ht 是矩阵范数，又如果 ||| A |||<1, 則 z — a 是 
可逆矩阵，且 

•蕙身 

U - A ) 1 = 

秦 = 0 

练习设 II • III 是上的矩阵范数，且假定给定的矩阵有一个具有性质 fBA — /||< 
1的“近似逆”证明 A 和 B 都是可逆矩阵. 

练习如果矩阵范数 i • II 有 | /|||=1的性质（如果它是诱导的范数，它理应是这样），乂如 
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果 AeM , 适合 |a |< i , 证明 



<;|</-A) • ;j < 



提示： 利用不等式|(/ 一 A ) 1 彳<2 可得到上界.对于下界，则利用一般的不等式 
i /:|/3 ill 和？:角不等式. 

练习如果^是一般的矩阵范数，我们都知道；/[,>】，在这种情形，证明，只要 i » Af < 
1,就有 

1 1 I < ,.( / 一 A)-' / ；；-!)] A '： 

练习如果 A , /36 M ., A 是可逆矩阵，乂 A + B 是奇异矩阵，证明1对任 
何矩阵范数 IHi 成立.因此，可以用一个奇异矩阵去充分逼近一个非奇异矩阵，不过有一个内 
在的限度. 提示 ： A + B = AU^A l B ). 如 #|A 则 / + A W 应该是钉逆的，因而 

有 ||'A 丨奉1. 

关于可逆性的一个有用而乂容易计算的准则不难由上一个推论得出. 

5. 6. 17推论 H 假定对所有 1 = 1. 2,…，”有 

m 

丨“《丨 > 2 I “衫 I • 

9 2 1 

则 A 是可逆矩阵. 

证明 •• 假设条件保证所有主对 ft 元‘是非 零的. 令 D = di a g ( ci ,,, …，则 D 是可逆 
对角矩阵， /) M 的主对角线上都是丨 • /3 = [>,,]=/— f ) W 的主对角线上都是零， 丘当, 
时〜 =一〜/〜,.考虑极大行和范数 f • I ... 假设条件保证 | B!|L <〗•于是根据 （5.6. 16>, / — 
B^D ' A 坷逆，因刖 A 可逆. O 

满足推论 （5. 6. 17) 的矩阵称为严 格对角 占优 矩阵. 这个可逆忭的充分条件称为 Levy - 
Desplanques 定理,并且可以对它们作稍许改进.见(6.1>节， (6. 2) 节和 （6. 4 ) 节. 

现仵®详细地 Q 沦 （5. G . 1>中的诱导轵阵 范数. 这是一些 K 常见的矩阵范数，并 K 它们有 
一个觅要的极小件® • 因为常常滿要采 用检验 |乃1<1的办法证明一个给定的矩阵 A 收敛，所 
以那些尽可能一致小的矩阵范数然受到 偏爱. 正如要证明的那样 • 整个 i 秀导矩阵范数类有这 
种合意的性质，并 II 这种性质刻化 r 诱导矩阵范数类. 

有限维空 N 上的任意两种范数珐等价的 • 所以. 对每两种矩阵范数 !!!• i 和 I * I ，存在一 
个最小的有限正常数 C M ( a , P ， 使得 i A 对所有 A 6 iW „ 成立，这个常数可 

以用 

CM(a ，") = =尚 

来计算.如果将《和沒的作用颠倒 过来， 则一定存在一个定义类似的最小正常数 C,,(/?， a > ，使 
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得1对所有 AG 成立. 一般地，两个常数 C A ,( a ， 々和 C M (沒，之间没 
有明显的关系，不过，如果我们考察本节末习题 23 中的表，它的左上角的 3 X 3 数表是对称 
的； 即 C a , G ，/?) = C m (^ “对三个矩阵范数卜 t ， H | 2 和彳 •！!. 中的任意一对都 成立. 这三 
个矩阵范数都是诱导范数，而上述对称性是所有诱导范数的一个性质. 


S .6.18 定理设 IH 。 和 MI # 是 CT 上两个给定的向滑范数，且设 1!.| L 和表示上的 
相应诱导矩阵范数，即 


定义 


则 


i 

Ar 

ik 


II x 

a 


IMI, 


R 。 货三 


ft W ^"^ x lTTL 


特别是 



= m 


r 滴 = ，韻 = 从. 

证明： 设火和 ^6(：” fi 给定的，且假定 .r 关0和 A.r 关0.则 


Ar 


1 Ai- I 

L II 

Ar | 

U 

k <R II 

Ai 

iu/j 

II ll 

• 

II Ar | 


1 ^ II, 

u 

l ^ ^ 一 

rr 



并 R , 即使 /U = 0, 这个不等式也成 i . 于是 

1 A lu " ^ a ， x TTii；- ^ ^ ^ WH 

WiW 对所有非零/有 


(5. 6. 19) 


(5. 6. 20) 


(5. 6. 21) 


| j^-j R a ^K^. <5. 6. 22) 

(5.(5. 19 〉 中的每个极值都被某个非芩向械所 达到. 所以存在向设^ z eC", 使得 ||. v || 2 = 
IUII ? = 1 ， II .vl 和 IUIL . 根据推论 (5.5. 15>，存在向姑 ^ecr 使得 

( a ) I <|| j . I 对所有 j .€ C " 成立： 

( b ) z\z= || z ||^. 

考虑矩阵利用 （ b > 有 


II 

i = _u 

^ of 1 

L = i 

.V L 1 Z^z 1 II V 1 

L 1 


1 

Iz 

II 。 1 

IHL 


Ull. 一 II 

z 



所以有下界 


另一方面，可以利用 （ a ) 得到 



=II y 11^. 




Wifii 有上界 






il A» < II )• IU 

合汴这两个界便有 

! .M, 、 R aJ R^ II v 11, _ R R 
. II v II, 一、心， 

它说明 （5.6. 22> 中等式可以 成立， 因 iM 证明 /*(5.6.20). W 为 恒等式 （5. 6. 20) 的右边关于 《 和 

/?是对称的，所以结论 （5.6. 21>成立. □ 

C 上的两个不同的向 M 范数能够诱导出上的相同矩阵范数吗？根据 （5. 6. 18>的下述推 

论可知 • 这种情形能够出现，申且仅当一个向 M 范数是 W — 个向燉范数的常纯 M 倍. 

5. 6. 23 推论 设 IhIL 和 Mb 是 C " 上的向 W 范数 • 乂设 | • IL 和 | • t 表示上的相应的诱 
导矩阵 范数. 则 |_ A | L =| f 4^对所釘 AeM •成 i , 仅当存在一个正常数 f , 使得 iuii a = 

_ dl . r ||;,对所有』_ ecr 成立• 

证明： 我们知 ifl , 

K * ^ ITlt = b'i ：： Ift] l^t] = 七 

w 此，冇一般不等式 . . 

>1、 （5.6.21) 

其中等式成立，当且仅当 



而这 SJ 以成立 • 当 R 仅4对所行^•关 0. 闲数 I ! X IL / II I 适常数. 因此， 如果 II/IL 
=<■ II -r II , . 就一定有 •，了 i , 于 M , 由（5.6.21〉 可知. 对所有 )\ 

且闪而. M 所有 ACM — li = t /\ 反过宋 • 如果两个 i 秀分矩阵范数相同， 
则由 （5.6.20) 可知尺 Wlfti 在 <5. 6 .24> 中等式成立，由前而的证明得知，比值 
IML / IUII ,, 是常数. □ 

5.6. 25推论设 || - IL W II - li , ^ r 上的向 M 范数，乂设 i • ||L flrj - %长示 M „ 上的相应诱导 
矩阵范数.则 iAKIiAi ., 对所有 A 6 A 人成立 • 当社仅当 A &对所存 A e At 成立. 

证明： 如果 .4 扒对所有./\6从成立，则冇 [ W 为 （5.6.21)] 这蕴涵 
^ R ita = \. W 此，根据 （5.6.21), 对所有 i A jt 口 

最后一个推论说明，没有一个诱导矩阵范数能够一致地小于另一个诱导范数.如果允许它 
同其他（不一定是诱导的>矩阵范数相比较，会出现什么情形呢？ 

S . 6. 26定理设 | 是 M ， 上给定的矩阵范数，且设卜 L 是上给定的 i 秀导矩阵范数•则 
U > 存在吣 上的诱导矩阵范数 / V ( o 使得对每个有 N ( A )< i |. A |; 




向量范教和矩阵范致 


217 


( b > ；|' A |< i|i -4 I ；对每个成立 • 当且仅当 .4 |= M 1 对每个成立. 

证明： 定义 C ” 上的向 M 范数 HI 为 

II -r II = | Xi |. X = [ j * j •… _ r ] e M „， （5.6.27) 

并且考虑由 II HI 诱导的 Mi 上的矩阵范数 〜（•>. 对任意 A 6 M _. 有 

N ( A )= max 11 ^ |j 一 max ^… - max 1 AX il 

^ ll-rll 一， i ![ n ]| ^ iff 

^ max 卜 = 1. A | (W 为 I • i ) 是矩阵范数）， （5. 6. 28) 

这就证明 Pah 为了 iih 明 U 山假定 MWlilA 匕对所有 成立. 则由 （ a >51 知，对所有 

AeM „ m 

N ( A ) dA |<|| U : L . 

/ V («) 和 ,1 • !|! a 都是诱导范数，所以由 （5. 6.25) 可知， N ( A )=||, A IL . 因而对所有 AEAt 

卽\ !|=| ^1- □ 

上述结果是促成给出下述定义的原 W . 

S .6.2 9 定义设1^1:是上的矩阵范数 • 如果对所冇适合 / VM )<| A !| 的•上的 
矩阵范数只叙/ V (• > = I | H ，， 就称!| •[是上的极小姓阵 范教. 

定 ffl ( 5.6.26> 的论断 （ b ) 说明 • iW •的每 ti 秀导范数是极小的.论断 （ a > 沒接推出每个极小 
范数是诱导 范数. W 此，如果想采用一个矩阵范数，而它乂不能（用所有矩阵上的 小值） 一致地 
加以改逬，耶么就可以采用诱导范数 ，)\ fl . H 介这种极小性的任一范数一定 是诱导范数. 

向狱范数（5.6. 27>是可由一个铪定的矩阵范数构造出来的粮 个向岵 范数族的特殊情形设 
IHI 是上给定的矩阵范数 • ： y € C ” 是给定的非芩向11用 

II J-llv ：| i . yeC , y^O (5.6.30) 

定义函数 ll.r ii . v: e — R . 则 Hi ， tier 上的向 m 范数 • a 对所有具有性质 

II Ar ||. v =# A(^*)||<«.AiHkv - iHfMil ll - rll ,. 

如果 j = 1 … l ] 7 , 则（5.6.30)简化成（5.6.27>.如果用 / V v ( •) 表示由 || • || v 诱导的 M „ 上的 

矩阵范数，这个不等式说明，对所有有 

N •、⑷ 三 ， nmf < ^ ax ( 5.6.3 d 

这显然是 （5. 6. 26 a > 的推广. 

如果给定的矩阵范数|卜:|是极小范数，则 （5. 6.3” 说明，对所有 A 6 M ，||| A 卜 / V 、. M ). 
闪为在上述论证中所采用的向 M . v 可以是任意非零向摄 • 于是 • 对所有非零 v ， z ec ”， 应有 

N y (*)=|| - |= N t (*). 

5.6.32 定理设； • 卜是 iVt 上的矩阵范数，〜•、(•）是用 （5.6.31) 和 （5. 6.30> 定义的诱导范数. 
则下列命题 等价： 
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( a ) :1|是诱导矩阵范数. 

( b ) If 是极小矩阵范数. 

( c ) |1=/^(*)对所有非零>^(^成立. 

证明： （ W 蕴涵 （ b ) 的论断正是 （5. 6. 26 b ). 我们刚才己经看到 • 如果 || 是极小范数•则 
所以 （ b ) 蕴涵如果 （ c ) 成立，则是诱导范数，因为根据定义， /^(«)是 
诱导范数. □ 

从这些论断 还呵得 出一些结果.如果 N v ( y 叫！ • I 对所有非零 ： y 6 C ” 成立，则 N / O 对所 
有非零 . v , 成立. 但是推论 （5.6.23 U 兑明，除了差一个纯撤 W 子以外，诱导一个给定的 

矩阵范数的 向撤是 唯一确定的，所以，对某个正常数有 = g HU . 

练习如果 At 上的矩阵范数 i • I 是由 C 上的向 M 范数 IM 诱导的，证明，对所有： y , z 

ec \ 有 Lvinuir , imi := imiiuii d 以及 t .，= ii ). r/iuir 向 m 范数 ih d 如 

(5.4. 12> 中定义的那样 • 是向 ft 范数 HI 的对偶. 

S .6.33 定理设 t . 给定的矩阵范数， 1 U 3 IH , 是用（5.6.30〉定义的 C " 上的向 M 范 
数.则下列两个论断 等价： 

<«>对每对非零 向坩 _ v ， zec \ 有正常数〜使 iu 对所行 . rec ” 成立. 

( i >> 对所 有』， . v , 且 c 关0 成立. 

如果 1 lift 诱导矩阵范数，则它满足恂等式 （ b >. li 由它通过（5.6.30)构造的向 M 范数满 
足 （ a >. 

证明： 如果 （ a > 成立，则 

1'^' ：|1^- 1= Ul II HI , - ( 1 /<、 ） II r || v r w IMI: = II I || v IU II, = 1 o • 1| III 饮 • 1. 

反过来，如果 UW 成 i ， 则 （ d 成钇 • fl cv=.i - rv * l /] i \ zz ' l 已经证明，如果 N v (.)=|. if , 则 
( a >[ W 【〖 ii < b ) 也]一定成立.而如果 • | 是 i 秀导范数，则根据 （5.6.32), 悄况就是这样. □ 

练习我们知迫，一个诱导范数的任一•正 纯蛾倍 数满足恒等式 （5.6. 33 b >. 证明矩阵范数 
Ml . 和1卜11 2 都满足这个悄等式 • 不过这两个范数都不是一个 诱导范 数的纯 M 倍数. 

仵（5.6.2>中已经看到，如樂 v | 足诱导范数 • 则 i |/_ j != l . 遗憾的是，这个性 质对 矩阵范 
数为 i 秀导范数的啪实不是充分的.容易证明，闲数 

:|: A ;三 max {1 } (5. 6. 34) 

定义了 上的一个矩阵范数，且 但是, 因为 MKiM ! 对 所有泌 eM „ 成立，且当 

A= \l 时， 所以 hi 不是极小范数， 因而 不可能是诱导范数. 

练习验证 （5.6.34) 定义了一个矩阵 范数. 更一般地，证明，如果 . HU ， 是从 
上给定的矩阵范数，则 ' 
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定义了 上的一个矩阵范数. 

诱导范数在所有矩阵范数中是极小范数，但是，假定现在只考虑由酉 不变矩阵范教 组成的 
一类*要 范数. 这是一些对所有和所有酉矩阵17, V € M b , 适合 I A | = ||| CMV l 的矩阵 
范数 1 HI . 可以 证明. 在这类范数中只有一个极小范数，那就是谱范数. 

S . 6. 35推论如果 HI : 是酉不变矩阵范数，则丨对所有 成立. 谱范数彳 -| 

是上仅有的既为诱导的乂为酉不变的矩阵范数. 

证明： 假定 | H 是给定的酉不变矩阵范数，由定理 （5. (5.26) 的 （ a > 可知， / V ( A ><|| iA ||: 对所 _ 
有成立，其中 N ( A ) 是由用 （5. 6.27) 定义的向 M 范数 HI 诱导的范数，如果 
两矩阵，则有 II W || =||| L 7. Y | HXif = IUII , 向量范数 HI 是酉不变的.如果 > r € C ” 是 
给定的非零向域，则存在酉矩阵 g 使得 U ., - || x \\ 2 t x . 于是对所有 j ： ec n 有 II I II = 

II II X !| 2 c / v , II = lull ： IIL / V , || = II V ： ii II . 因而 • 向童范数 11.11 是 Euclid 范数的纯摄 
倍，而推论 （5.6.23) 说明，（用 Ml 诱导的 fc 阵 范数） 〜（•> 等于（用 H | 2 i 秀导的矩阵 范数） 

1 - | 2 . 因此对所有有 H = V ( A)<:||A 如果假定 il , . lli 是诱导 范数，则它是极小的 • 
Wifu | A|-|A 1 对所有 A e M , 成立. □ 

如果上的矩「斗 范想. 利用 

定义的函数 Hir 也是 M N 上的矩阵^敛，直接计算说明，对所有 || A 11/ = II A || 2 = 

11八|| 2 , fl II A llr = II A - II , = || A II ,, 但是， 并非每个矩阵范数都有这个性质，这是因为 :| A |||; = 
im 适合 |•|| p — . j 的珩阵范数称为自 伴的. Frobenius 矩阵范数和/,矩阵范数是 

ft 伴的， 又因为 

If A - I =^AV > = p ( A - A ) 

所以 谱 范数也是 Pi 伴的.实际上， Mi 上的所有西不变范数都是 ft 伴的[见（7.4> 节，习题 2]. 

谱范数可看作是仅有的自伴诱导矩阵范数. 

S . 6. 36定理设 II 是上给定的矩阵范数.则 

( a ) III - r 是诱导范数，当且仅当 ih 是诱导范数. 

( b ) 如果矩阵范数 HI 是由向 M 范数 HI 诱 导的，则||>|•是由对偶范数 II . I ! , J 诱导的. 

(C) 谱范数是 M ， 上仅有的既为诱导的又为自伴的矩阵范数. 

证明： 如果 N (0 是矩阵范数，乂如果 N ( A>d A |- = | A 1 对所有成立，贝 IJ 
/ V(A > = / V(i )<||/\||对所有八€^1,成立.如果、； I 是极小矩阵范数， N (.)- = ||| - I ，因而 
N (0=| H 、 所以 M •是极小矩阵范数.由 （5. 6. 32) 可知论断 （ a ) 成立. 现在假定 Hfl 是由向 
tt 范数 Ihll 诱导的.利用对偶性定理 (5.5. 14>,有 

IMII ' = II I = max || Ax || = max ( | Ax ||°) D 

B ^ 1 « xf”l 

=max max | ( Ax ) 'z | = max max \ x'Az | = max |i Az || D , _ 

1 rl=, *^-1 i[309 
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w 而是由1卜11"诱导的.关于 M 后一个论断 • 我们注意到，如果矩阵范数 1- i 是由向 M 范 
数 IMI 诱导的，且 HlhHf ' ( b ) 说明 I ! •[也是由|卜『诱导的.但是推论（5.6.23〉说明，除了 
差一个 正纯坩 因子外 • 诱导一个给定的矩阵范数的向 M 范数是唯一确定的，因而，存在某个*>0 
使得 Hl u = d 卜 II . 子是，由（5.4.16),—定有|卜|| = |卜|| ? /心.因为给定的向量范数是 Eucldi 范 
数的一个倍数，所以它们都诱导同一个矩阵范数，由此得出 □ 
练习证明，只要 M : 是矩阵范数， Hr 就是矩阵范数 • 

练习给出一个例子，说明自伴矩阵范数不一定是酉不变范数. 

在 （5. 5) 中引进的绝对向 M 范数和单调向 tt 范数通用的向 M 范数.用单调向 M 范数诱 
导的矩阵范数有一个简单而乂有用的特征. 

5. 6. 37 定理 设 HI 是 CT 上的向 M 范数 •if 是由它诱导的上的矩阵范数，则下列命题 
等价： 

Ca ) HI 是绝对 范数； 即 || 丨丨 II = Ilu ， l | 对所有 ■ rCCT 成立. 

<b) 1HI 是单调范数；即只要 Ul<l：yl ,就有 lUHSII . vll . 

(c) 如果 f)=diag (义 • 义，则 

I I ) i = max ' d . |. 

ICr 

证明：（一与^} 等价足 (5.5. 内容. 如果 |卜|| 单调范数，乂如果令 

d = max I d , \ =\ J k | , 

IW if 

则 I Di 1 < I cAr I , W |M It Dx II || .r || • fl ^ 时等式成立，于是 

Wlfii(bH 涵 （d . 如果假定 （ c) 成立，设 I, ：yeC ” 是给定的 ， H | j - | < | v I , 汴葸到 存在 
3T0) 一组复数 A 使得 U* 丨 = d k y k , K | | <1， /r=l,W 此，如果 D=diag(c/ |f ••• , 

cU , 则冇以= U I和 w 为 

II III II = II Dv II || ^ II < II V I!. 

所以范数 HI —定是单调的. □ 

习題 

1. 试给一个关于矩阵的向#范数的例子，它适合11/11 <1. 

2. 满足的矩阵 A 称的为¥等的.试给一个不同于/和0的 2 X2 幕等矩阵的 例子. 
证明0和1是幂等矩阵仅有的特 征值. 证明幂等矩阵 A —定可对角化，乂如果 A#0, Wl \ lA \\ { 

对任何矩阵范数成立. 

3. 如果 iH | 是上的矩阵范数，证明 • 对所有（•>】，是矩阵范数 • 但是证明，对 

任意 t <l, r I - ill , 和 HI • II, 都不是矩阵 范数. • 

4. 在定义 (5.6. 1>中，同一种 向搶范 数有两种不同的汁算 方式. 更一般地，可以定义|||.||^为 

' ! ' A !L^ = max ( |j Ar ||^ 
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其中 IhlL 和 Ml ,, 是两个（可能不 N 的） 向 ft 范数.这样的函数 | •1.,是矩阵范数吗？试研究一 
n - il .^ 确定它可能具：有那些有趣的性质：注意，这个槪念可用来定义关于矩阵的范 
数，这是 W 为 IH , 可以取 CT 上的向 M 范数 • Ifi ] Ml ,, 可以取 C " 上的向 M 范数.在这个意义 
T • • || U 有哪些性质与诱导矩阵范数是一样的？ 

5. 证明 Euclid 范数 H | 2 和进范数 H 邰是 从上的 两不变 范数； 也就是说， 只要 I ；和 V 
都是两矩阵 • A 与 L /.4 V 就有相问的范数.试就你能考虑到的各个方面，对矩阵范数||叫| 2 与 

作一 比较. 注意 || A|| 3 =[tr 

6. 证明关于 i |: • ||的公理（1>〜（3>对（5.6.7)中的^.!^同样 成立. 这证明了，如果在 
( T ). 6. 7 〉 的假设和结论中用“关于矩阵的向揪范数”代替“矩阵范数”， （5. 6. 7) 仍然成立. 

7. 如果1卜|:是 M ,, 上的 i 秀导矩阵范数 • 乂加 ife . SeM ,, 是非奇异矩阵，证明[如 （5.6. 7> 中定 
义的] IH ’ 也是诱导矩阵范数 • 加果 1 • 由向狱范数 IM 诱导的 • 证明矩阵范数 || • I 是[如 [3 U 
(5. 3. 2>中定义的]向 M 范数 II - lls •诱导的. 

8. 证明的非奇异 轵阵泎 M " 屮是榈密的：即证明 iVt 中的每个矩阵是诸非奇异矩阵的 
极限，奇异矩阵也有中稠密吗？ 

9. 证明，对所有由 CT 上的向《范数组成的集合是 凸集， 似是，对任意由 

•上的珩阵范数绀成的集合不是凸集. 证明. N (0= | + 足矩阵范数，当民 

仅当对所有 A , BfiW ,. 冇 

[ N «( A >- N ? ( A )][ N ,( ii ) - N .( H )] ^ 2[ N ,( A ) N ,( B ) - N t ( AB )] 

-f 2[ N 2 (/ A ) N ,(/3) - N 3 ( A «)]. 

提示 ： ^Ife N ,(-) = ||.||,. N ,(-)= IMIr . 及 关于矩阵范数集的一个承 

要子集是凸集的丰实 W •例 （7. .1. 54 >. 

歸 

10. 证明 • 上的/,范数 M II , = S 丨 《•, 丨 铥矩阵 范数，但不是诱导范数. 

• •广 I 

11. 证明下述各个恒等式都是计 wm 范数 （5. 6.6) 的等价 形式： 

A ；jL = max || Ar ||. = max 

•i J II. * I • r I 

— max I v ' Ai ；= 

y J ^ ^ \ I 

利用这些恒等式证明 !|; Ajt 2 =;t A -仏 对所有 AeM „ 成立. 然后利用 li • | 2 是矩阵范数和 A'A 是 
Hermite 矩阵的事实证明 |: AA * | = |； A * A ||, =!| A 

12. 如果 〆 A ><1， A 6 M ., 证明级数 /+/\ + A ? + …收敛于和 （/一 A ) *. 

13. 如果不是可逆矩阵 • 证明对每个矩阵范数有 I / — 

14. 设! |!，1 L 和 HL 是 M ” 上给定的矩阵 范数. 证明; | A ， max { ltAtL ， ^以是从上的矩 

阵范数.什么时候它是诱导范数？ _ 


I AHI: 


_ ^ II : 

\u 


\yAr ). 




15. 试给一个矩阵 A 的例子， 使得 〆 A)<|A >对每个矩阵范数|叫|成立. 

16•设 A = [〜] 6 AC 证明，用〜 | 定义的 M n 上的函数|叫||是矩阵范数, 
而当时，它不是诱导范数. " 

17. 利用习题12的想法计箅矩阵 

1 一 2 11 
0 1 3 

.0 0 1 . 

的逆.提示： 在级数中只有三项非零. 

18. 说明如何推广习题17中的方法求一般非奇异上三角矩阵 的逆.提示： 选一个 
对角矩阵 D , 使得 DA 的主对角线上都是 1. 

19. 证明，潜半径 〆 •） 是上的连续齐次函数，但是它既不是 M ,. 上矩阵范数，也不是 
At 上的向 M 范数，这是因为， 

( a ) 玎能对某个 A 关0,有 〆 A )«0; 

( b ) 可能有 〆 A + 

< c ) 即使 〆 和 〆 m 都是非零的，也可能有 〆 

提示: O □, C :K ;]. . 

20. 证明 || AB || /3|| 2 和 || || A || 2 丨 对所有 A , B 6 M n 成立. 

21. 证明! ||>\|<:; A|L ; At . 对所有 AeM , 成立.提示： ^( A - A )<|| A - A \ i ， 且 ||| A . |, 

= M 1. • 

22. 设 ml 是 cr 上给定的向姑 范数. 定义 im # e ( ii . iijd 为对偶范数.设 HL 和 l.t 
分別表示由 IIHL 和 HU 诱导的上的矩阵 范数. 利用 （5. 6. 36) 证明， | AH = || A | 对所有 
A 6 Ai 成立. 证明 || A 佾对所有成立，并且说明是怎样推广了习题21中 
的 结果. 这个不等式与= 时的 （5. 4. 13) 有何关系？ 

23. 验证，下表中的各值 给出的诸最 佳常数 C M 使得 jAUKCVIlAll ^ 所有成立. 
表中的所有范数都是矩阵范数.表下面的提示（/， ）> 与表中确定的（/•， ）） 元 相配. 每种情形都 
给出 r 一个矩阵，对这个矩阵 • 不等式〗 a : l <( 、:! 对常数的给定值是等式. 



下列矩阵都是中的矩阵： 

J 是单位矩阵； 

J 是所有元素都是1的矩阵； 

A , 是其第1列的所有元素都是1而其余元素都是零的 矩阵； 

A 2 是其（1， 1) 元是1，而其余元素都是零的矩阵. 

(1, 2〉根据 （5.6.21), 可从（2， 1) 得到. 

(1， 3) || A | I <|| A || l < n|A i * 

(1, 4) A ,. 

(1 ， 5) max[2 lei, l] 2 <E[S 丨 〜 I J < [ E 1 ][ 2 I ^ I 2 ]* 

lW ^ H #^| i«l I ■丨 >«1 »- 1 

(Cauchy-Schwarz 不等 式）； A x . 

_ 

(1，6) max Y] I I ^ n max \ a if \ i J . 

(2, 1> 从 （2, 5〉和 （5, 1) 可得； A ；. 

(2，3) 从 （2, 5) 和 （5, 3>可得 i A ,. 

(2, 4) 从 （2, 5) 和 （5, 4>可得； 

(2, 5) ||! A | =^( A - A ) < A) = tr A * A = || A || f , A ,. 

(2，6) 从 （2, 5) 和 （5, 6) 可得： J. 

(3，1> 根据 （5.6.21). 从 （], 3) 可得： .4-,. 

(3, 2) 根据 （5.6.21), 从 （2, 3>可得 * 

(3， 4) A ;. 

(3； 5) 类似于（】， 5), 

(3. fi ) 类似于（丨， 6), J. 

( 4 ，22 I 71 max 2 I I • 1 • 

f \ #--! 

U ，2) 从 U , 3) 和 （5, 2) 可得； 下述矩阵用两种方式给出 等式： 取注意6广 

T*' • 

且3)#0时二>*' =0而_/ = 0时它等于 W 设 A 的（々， >) 元是，并且验证， A-A = 

III A il A IL ^ W 2 和 II A \\ 2 = n. 

(4, 3； 类似于 （4, 1), /. 

(4, 5) [2 \a, IJ = 2 U > Ik l <+ S [IS l 2 +k I 2 ]， 

(算术-儿何平均值不等式 >; J . 

n 

(4, 6) 2 丨 〜 K n 2 max | | ； J . 
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( 5 ， " 2 S S 2 「土 1 ' max 2 ! |] 2 ； /. 

j-i *” 丨 >-i i-i 

M n 

(5, 2) 2 I “,， I : = tr A * A = 2 X,(A A) ^ f ,X tnMX (A' A)； 1. 

“> •1 f - I 

(5, 3) 类似于 （5， 丨>: /. 

n h 

(5, 4> 2 k , l 2 d “v 丨1* •〜• 

i • y " 1 #•>— I 

H 

(5，6) i a,, p ^ /r rr.ax | a„ - ； J. 

,.>-i 

m 

(6 ， 1) max I “•，I < max ]>] I ti ,. | ; I. 

"7 T | 

<v 

(6 ， 2) max | a,, p < maxY] i a„ p' = max(.A* .A). < o(.A" A); I . 

K " 卜- •，"i -1 11 ^ - 

(6, 3) 类似于 （6, 丨>: /. 

轉 

(6， 4) max I a„ 1^； V | «„ | ; A：. 

^ WV « ,.,-rl 

(6，5) max ； a,, P < V f a,, |* i A 2 . 

i、.— ，.^ , 

24. 证明习题 23 中界 （5, 2)可改进为 ||A K[ ran k A ] l 2 || jA | k . 提示 ： rankA = A.A 的 
[ U .5] 非芩特征值的个数. 

25. 设 AeM ” 是给定的乐 阵. 由引理 （ 5. 6. 10) 可知，存在某个矩阵范数 | Hi 使得 〆 /\>< 
lAl ^ AJ - fe . 证明存在作奇矩阵 （，=(， U ) eM ” 使得 〆 A ^ jlOU 、'||* <^( A )+ e . 提 示：利 
用与引理 (5. 6. 10) 中相同的构造法,并且证明，当 e -0 时 “ V\C , [|?= / a ( A * A )- f -0( e ). 

鳍 

26•证明 ，II A ^ ; A - P 对所有成立，其中等式成立，与且仅当 A 是正规矩 

阵 • W 为这个理由，数值 

[ II ^ it ； - i ' u p ] 1 * 2 

广雇 

冇时称为正觇性亏损值. 提示： 利用 Schur 二•角化定理和 Frohenius 范数是丙不变范数的#实. 

27. 利用定理（5.6.9> 和友矩阵的以给出实系数或 复系 数多项式零点 的界. 任总—个次数 
至少是丨的多项式 /( sr > 可以写成 /( s )= CV />( c ) 的形式,其中 C 是非零常数, 

pizl = z” ^u m l z m 1 ♦ a n z z" ' 十 … + … z 十仏， （ 5.6.38) 

/>(d = 0 的根是 /( z > = 0 的非零根，并 ft 对于这些根，我们可以给出各 种界. （ a) 证 
明，友矩阵 

U\ — a„ 

0 0 

0 0 (5.6.39) 

[ 0 0*10 
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的特征多项式正好是 PQ)，WfWC (/ >) 的特征偯与 〆 幻 = 0 的根 相同 . 提示： 计算 det[W- 
/ 时用其第 I 列的代数余子式和！ L1 纳法 . （ b) 利用定理 （ 5. 6.9) 证明， 若 2 是 />(」= 0 的根 
乩卜 ;|, 是上的任一矩阵范数，则 U 丨 <: (:(/ ， >l,L 如下 • S 表示 〆 d = 0 的任一根 . （ c > 利 
用 | • I ，证明 


I z |< max{ 丨 |，1 于 | “， | •…，1 +| a*. , |} 
< 1 + max{ ! a u I , j | 1 }• 


(5. 6. 40) 


这个关于根的界称为 Cauchy 界 .（ d > 利用 j • 〖证明 

I ? I < maxi 1 • I Wo |4-| a , I 十… +1 I } < 1 + | 〜|- f ! a , 1+ … + | i |. 


316 


这个界称为 Momel 界.证明它比 Cauchy 界要粗糙. （ e > 利用 H |, 证明 

I z I ^ (w — 1 ) -4-1 Uo H I 1+ …+1 A I I • 
对于所有 ">2. 这个界比 ( d > 中的界粗糙. < f > 利用 HL •证明 

I ; l<[«+Uo P-H Cl, P + …+|“ 歸 ■ I 2 ] 1 ' 

这个界比 Carmichael 和 Mason 界 （5. 6. 42) 粗糙. ( g ) 利用证明 

! c | ^ // max{ I . | u„ I • | <ii I •…， I I |} , 
它比 （5. 6. 11) 中的界粗糙 • 


(5. 6. 41 ) 


28. 利用习题27中相同的 记号, 我们珂以改进其中 （0 项中的界.把友矩阵写成 
H 其中 


ifii 



0 

0 

… o 

0 

] 

0 

… 0 

0 

0 

1 

••• 0 

0 

• 

• 

• 

• 

• 

0 

• 

• 

• • 

• • 

• • 

• • 

• * 

• 

• 

• 

• 

• 

• 

.0 

• 

0 

• 參 

… 1 

• 

0 



然后证明 S K = 证明 US - S | 2 = 1 和 | a , | ： - 4 | 

证明 



fic(p> ： g=| ( ，(/ >> • a p > I = j<s+ r > • (s 十 /o | 2 

由此推导出 Carmichael 和 Mason 界 

I i l < [1 -fl a 0 I 2 +| a , P + … + U . i | z ]' /2 
29. 把界 （5. 6. 41 > 应用到多项式 




(5.6.42 〉 [3T7 
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qiz)= (r — l)p(z) 


(a r -i — 1) z" -f- ^ 广 1 + … 4 - (a. 


cio 


然后证明 

I z K maxi 1 • ! a 0 |- f-i a 0 — a , |+ ••• +| a r2 — a^. x |+| a^i 一 1 | h 
证明这个表示式的第 2 项不少于 1, 并且推导出 Montel 的另一 个界： 

I z |<1 do l + l a, t — |+ … +1 a rt — a rl | + | a K . x — 1 | 


(5. 6. 43) 


30. 试用 Montel 界 （ 5. 6. 43) 证明 Kakeya 定理： 若 /( z) 二 “,〆 i 1 十 … + aiz + a 0 是 
一个给定的多项式，其系数仏均为非负实数 a 在心的意义下是单调的， 
则 / U )=0 的所有根都在单位岡盘内，即 

31. 前面四个习题给出的都是关于 />(z) = 0 的根的绝对值的上界，其实也可以得到它们的 
下界 • 证明，若 PU) 是由 （ 5. 6. 38) 给出的 a 垆 0 的多项式，则函数 


q ( z ) =丄 fp (丄)=? 丨 + …+ +丄 

^ / a 0 a, t a 0 a 0 

是一个次数为 ”的多 项式，而它的各个根正好是 />( S )=0 的各个根的倒数.试用 (/( dsO 的根 
的各相应上界得到 p ( z )=-0 的根 S 的下述下界. 

C ' auchy : 


1^ 


^0 


{ 1， | 〜| + | tV , | , | Cig -f I 


!*•••* I flu l + l ai I} 






I av *f mflxU ， I I t I 


， U 1} 


Montel : 




I 


rr . dx { I d 0 ! • 1 t *| a t H ~| a t 1+ … + | a^-i | }* 

I ^ I 




、 H 〜 1 十 I |+ ••• +1 a^ i 


Carmichael 和 Mason : 


I ; i >_! a o I _ 

/[1+ lcl 。 I 2 -H Cl , P + m+Uh n >,2 . 

32. 当把习题 31 中的 F 界与习题 27 〜 30 中的上界结合起来时，就有可能把 p ( 2 > 的根确定 

在一个环域 U : 内.例如， 考虑 

/u> = & + + … + 士/ 十 =+ 1 ， 

它是指数阐数 〆 的幂级数的”次部 分和. 证明 fU )=0 的所有根 S 满足不等式 

Y ^1 ^ 1^ 1 + w ! • 

把 Kakeya 定理应用于 z ”/( l / d , 试证明所有这些根实际上满足不等式丨 S 丨 > 1 . 

33. 因为对任何非奇异矩阵 D 有 〆 /^=^0 l AD ), 把习题2 7 中所采用的方法应用到 
D 一 1 C (/0 D 可以得到 （5. 6.38) 中的多 项式/ 的根的其他界.为了计算方便，我们选取£)= 
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$:讨论关 F 矩阵的向墩范数，即向*空间 iVt 上的向童范数（它可能没有次乘性质〉.这样的范 
数常常称为广 义矩阵范数. 我们将用 HI 或用表示上 一 般的向 M 范数 • 并且从 ivt 上 
的某些向 M 范数的例子开始，它们可能是 • 也可能不是矩阵范数. 

例1如果 （)（•> 是上的向 tt 范数，乂如果： T ， 是非奇异矩阵•则 

(； 7 . s (. A ) = CAT AS ), A e M „ (5. 7. 1) 

足上的向域范数.即使 （)（•> 是矩阵范数，也不-•定有次乘性质. 

[320] 练习证明 （5.7. 中的 G r . s (0 总是 M ” 上的向撖范数. 

练习设 . s = r =|/, 设 G (0 =|MI • 证明不是矩阵范数. 

练习■证明，如果 （；（•） 是矩阵范数 • 且了=3 _，则 g 7 . s ( o 是矩阵范数. 

例 2 两个同阶矩阵 .4 = [〜] 和 B = [~] 的 Hadamard 乘积正好是它们的对应元家的乘积 
八。/《三人,] . 如果 H 6 A 1 fi 没有零元 索的已 知矩阵 ，（)（•） 是上的任意向 M 范数，则 

(;„(A> e(;(H 。 A> (5. 7. 2) 

是上的向 tt 范数.即使 （)（•）& 矩阵 范数. 也不一定有次乘件质. 

练习证明 （5. 7.2>中的 G „(0 总是向址范数. . 

缠习 iiF . 明（5.7.2>中的（；„(0足 • 或者不坫妒阵范数，取决于对 H 的选择.芩虑矩阵范 
数 0)= HI ,, 及 Hadamard 乘子 W 阵 
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你可能想考察 

“[::卜[::卜 
注意 G „, ( CKG … （ O 对所夯 C 6 M ： 成立 • 

例3函数 




a + d l-H a-d |-H 6 H-| r I] 


(5. 7. 3) 


(5. 7. 4) 


(5. 7. 5) 


是 M 2 上的向 tt 范数. 

练习证明 （5.7.5> 中的 （；（•> 是向 M 范数，但 不是矩阵范数.你可能想芩察（5.7.4> 中的 
矩阵. 

例4如果 A ^ M h 是给定的 矩阵. 则集合 F ( A )^{ x \ A J - : a 6 C 旦 *r 称为 A 的值 

域或數值范围， | W 函数 

r ( A ) = max | j • Ar | = max | s | (5. 7. 6) 

»*« I »€ F « A ， 

称为 A 的教值半径. 

练习证明数值半径 以/\>是 上的向 M 范数. 提示： 较难验证的部分只有正定性公理 
da )； 见 （4.1) 节，习题 6. 但是 • 数值半径不是矩阵 范数. 见习题 10. 

例 S 上的 /,. 向 M 范数是 


229 


向量范教和矩阵范教 


|| A |!.. = max I 6/ (> |. (5. 7. 7) 

ft (5.6> 节中已经知道， MU 是上的向景范数而不是矩阵范数，不过 n MU 是矩阵 
范数. . 

上述几个例子足以说明，确实有许多向 M 范数不是矩阵范数.此外，在这些范 数中， 
行些 M 时具有从次乘性得来的某些矩阵范数 性质. 有些则不具有. 但是， 从上的每个向最 
范数等价千任一矩阵范数（在它们有相 N 的收敛序列的意义下）：枣实 h . -个更为一般的结果 
可 H 接由定理 （5. 4.4) 得到. 


S . 7.8 定理设/是 M ■上的准范数 • 即上正定、齐次和连续的实值闲数.另外设 Hi 
上给定的矩阵范数.则存在冇限正常数 （：„ wr M . 使得 

/⑷ < | ⑷ (5. 7.9) 

对所存 A 6 A 1 成立. 特別是当/(…是 Mi h 的向贵范数时 • 这两个不等式成立. 

如果把有关矩阵范数的结论推广到 v .子矩阵的向 M 范数或更一般地推广到关于矩阵的准向 
M 范数，不等式 （5. 7. 9) 是很有用的.例如，极限 （5.6. 14>就可以在这个意义下推广. 

5. 7.10 推论如果/是 Mi 上的准仓数，：4彳对所有 AeM ^ limC / XA *)] 1 '* 存在，旦对所冇 A 

表 •• • 


limiVM*)]'* = p(A). 

特別是，/(…是^，上的;3}公范 fcm 这，扱届成立. 

证明： 设 IH 是上的矩阵范数，考虑不等式 

它_ 

< [/(f >； T * < CH ", 

K 屮々=1，2, 3,….但是，今々— 幻时 ， （r —K ( V ^ l 和 〆 々）• 所以我们得 
知，存在且等于^/\>. □ 

在另一种意义 F ， 上的仟一个向《范数都等价于一个矩阵范数，这在前面的例5中已 
举例作 r 说明. 可以用常数 W 子 w 修改向 M 范数 IM . 使它成轵阵 范数. 这种情况不是偶 然的： 
每个向 W 范数都可以这样修改. 


5.7.11 定理对于 iW ” 上每个向 M 范数 “（•>• 存仵有限正常数以(；>,使得 (( GK ；(0 是 A 1 上 
的矩阵范数.如果|| • i 〖是 M ,, 上的矩阵范数 • 乂如果对所有 AeM n 有 

i ^(' r ( A ) ^ C M ']：, (5. 7. 11 a ) 


则 


〆 (;)<_• 

此外，存在一个矩阵范数，使得关于 <((；) 的这个上界是可以达到的 • 所以 

( ((;) = 是矩阵范数 fi (5. 7.11 a ) 成立卜 





证明： 对任意 r >0, 函数 ! I •||: BrG (*) 可能不满足次乘性公理，但它满足矩阵范数的所有 
其他公理.此外，很容易从 GO ) 的连续性和 G (*) 的单位球的紧性推导出 


(G) - max 

a ^ o^b G( A)G(B) 



G ( AB ) 


是有限正数.于是，对所有 A , BeM „, 


G ( AB ) < t .( G ) G (/\) G ( B > 和 c ( G ) G ( AB ) < c ( G ) G ( A ) c ( G ) G ( B ) 
假定 || • I 是上的矩阵范数，且假定给出了（；(*>与 ; !《彳间的不 等式. 于是 

G(.AB)^C m •圳 I < :S 翊 B I < ^0(A)G(B) 9 

因而 


如果我们特別选取矩范阵数 ! I • f = c ( G > G (0， 则 C M = r ( G >, fiC m = l / c ( G ) 9 所以 C M / C：i = 
r ( G ). □ 

练习 证明， 如果々 > t ( G )， 则 々(；（•> 是矩阵范数.特别地，证明总是矩阵 
范数. 

练习 试&接由 （5. 7. 11) 推导出 （5. 7. 10> 中的冇关向 M 范数的结果. 

矩阵范数次乘性的一个推论珐 7 述 爭实： 相位于上的每种矩阵范数 • 都有 （ T 上的某 
个相容向 tt 范数. 次乘件的另一个推沦 fi ， 对每个矩阵范数 1 . 1 有上的向 W 
范数 （;（•> 如果对所有 AfiVt 句 • Ail & MK 就称它为谱优 势的. 有©的是上的有些向 M 
范数 ACT 上有相荇向卅范数，而有些则 没有. 那些在 c - 上没有相容的向械范数的广义范数当 
中，有些足谐优势的，而有些则 +是.十是， 上的问岵范数在 （ T 上 n 了能有相容的向 M 范 
数，它乂不是矩阵范数. 


5.7.12 定义 CT 上的向饿范数||叫|称为与 M ■上的向 M 范数是相容的，指的是对所有 a * 
6 C 和所有 AeM , 冇 

II Ar || < G ( A ) IUH . 

有时采用术语协和的，而有时称向范数 Ml 从属于 广义矩阵范数 G (，>. 在前一节[例如， 
(5.6.27>， （5. 6.30>]中，已经述及了这些槪 念. 在这里要特別论述几个有关的 结果. 

5.7.13 定理如果 • ,|是上的矩阵范数，则在 C ” 上存在某个与它相容的向最 范数. 

证明： 如果我们定义 IMI 0 0… 0] if , 那么 II Aj !| =! l[Ar 0… o];HAO 0 … o ]|< 
㈤ 11(> o •" 0] H || A IIU II • □ 

我们已经知道了它的逆 命题. 定理（5.6.2> 说明，如果 HI 是 CT 上给定的向 M 范数，则存 
在与它相容的矩阵范数[诱导范数 （5. 6. 1)]. 

练习试说明由 （5.7.13) 确保的 C ” 上的相容向摄范数不一定 唯一. 实际上， || x || = 
tri … j ]1 也是可行的 • 因为对任意非零向量 yeC ” 有 IUII \ r\vlL 
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5.7.14 定理设 （；（•） 是上的向量范数，且在上有相容向最范数 HI . 则 G ( A )> yA ) 
对所有 AeM „ 成立. 更一般地， 

彡 〆 A , A 2 … A *> (5. 7. 15) 

对所有 A " A 2 ，…， A , 6 M n 和所有6 = 1，2,…成立 • 

证明： 假定々 = 2,且设 jeer 是适合的非零向禎，其中丨 AlqdU •则 
f)(A y A 2 ) II x || = II Aj* II = II A x A 2 x II 

=II A,(A 2 x) II <G(A.) || A 2 j|| <G(A i )G(A 2 )|| j||. 

因为 111 11^0,由此得出 〆 A , A 2 )< G ( A ,) C ；( A 2 h 类似地用归纳法可以证明一般 情形. □ 
什么时候 M w 上给定的向 ft 范数在 C ” 上有相容的向 ft 范数呢？条件 （5. 7. 15) 是必 要的； 
为了证明它也是充分条件，需要一个技巧性引理. 

5.7.16 引理设（八0是^^上适合（5.7.15)的向董范数，乂设1*| 2 表示；^上的谱范数.则 
存在有限正常数(: = t ( G )， 使得 

。(△…(八少”以耒） SciAA … A * | 2 
对所 冇八， /\ 2 ,…，和所有々 = 1, 2,… 成立. 

证明： 根据推论 （5.4. 5>,存在有限正常数使得 ||A 对所冇成 

立. 设々是给定的正幣数， fi 设 A ,, A :, …， A *6 M _ 是给定的 矩阵. 根据奇异值分解定理 
(7.3.5), 有酉矩 wv , w 以及对角矩阵 2 = diagU ,. 力， •"• ^),其中，所有 〜>(), 使得 
= •和 〆 2> = m a xU . a ” •"• aj = ! A , A •，…火| 2 .报据 （5.7. 15>, 冇 
G(V )(;( A .〉 G ( A :> … G ( A *> G ( W > 彡 〆 … A * U 0 

= / o (2) 



=|8 A, A ： -A* I ， 

后一个等式成立是闪为«范数是两不变的.因而得出， 

以戰)••儀 》 G ( v 4 (wo i i Am >f ^ Jwl ^ AlA2 ... Ak I 

=b 2 1| A 】 A 2 … A* i|” 

如果取引理的结论就证明 r . □ 

5.7.17 定理设 （；（•） 是 iW „ 上的向撳 范数. 则存在 C ” 上的向 M 范数||叫|使得 

II Ar || < G (. A)|I x || 

对所冇和所有成立，当 R 仅当 

G(A,)G(A 2 )-G(A*) 彡 〆 
对所有 A ,, A 2 ，…, 耒 和所冇务=1, 2,… 成立. 

证明： 必要性已在定理 （5. 7.4) 中证明.关于充分性，需要证明，存在上的矩阵范数 
[1使得（； ( ^\»14|对所有4€吣成立.设 IMI 是 C " 上与 I • 1相容的向量范数[定理 
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(5. 7.13) 保证它存在 ], 且设和是给定的.因此，如果能构造出以 GO ) 为优势 
范数的矩阵范数，就证明了 II A_r II <|| Ai\\\x || < G ( A ) |U || . 

对于给定的矩阵 A 6 M ,, 有无数多种方式把 A 表示成若干个矩阵的乘积或若干个矩阵的 
乘积之和.定义 

|| A ||| Ei n f {2 G ( A , 1 )". G ( A >t ,> : = A , 且所有 6 M ,}. 

f 9 

如果 SA , r “ A += A ， 则根据引理 （5. 7. 16) 和关于谱范数的三角不等式，有 

2小 ，••〜 lit 彡42«, I 〜 |||A !• 

I « « 

由这个不等式可推出，所构造的函数!| • 1 是正 定的 . il • f 的齐次性可直接从 g (*) 的齐次性得 
_ 出. 关于 || • III 的三角不等式和次乘性可由它作为乘积之和的下确界的定义得出. □ 

练习详细证明，上述定理中所构造的函数!〖• I 满足三角不等式， a 有次乘性质. 提示： 
如采 C=A + 衫或 C = AB . Wij (分 別） 作为乘枳之和的 .4 与 B 的每个表示式给出 C 作为乘积之 
和的表示式，但是， Jf •非 C ' 的所有这些表示式都以这种形式出现. 

练习 考虑 上的向 M 范数（5.7.5>,假如它 AC 2 上有相容向 M 范数 IH ,则可证明 

^ II[:] IIHIL 0 :] [:] H4 ： ：]||[；]||* 

fl 1|[：]|=11 [::] □!-•[； o °]||[：]|* 

它组涵 

II[:] II- [:: H ： :]11[:]11 ， 

_ 

-< ： : H ： ：]• 

试证明这是不能成立的，由此可知^^上的向飧范数 G (.) 在 C 2 上不可能有相容向量范数. 

练习（续）即使上的向 緻范数 （5. 7.5) 在 C 上没有任何相容向被范数，也可证明它是 
iS 优 势的. 试根据定理 （5. 7. 17〉进行讨论. 

现在， 知道丫关于上的向蟥范数在 CT 上有相容向 I * 范数的有用的必要充分条件.同 

时也知道，只要在 C ” 上有一个向*范数，则诱导矩阵范数 （5. 6.1) 就是与它相容 的 / Vt 上的次 

乘性向 M 范数. 那么，什么时候 C ” 上的向请范数在上有非次乘性的相容向量范数呢？这 
样的范数总是有的. 

5.7.18 定理设 M | 是 C ” i ： 给定的向量范数.则在上存在不是矩阵范数的向请范数 
327) C ；(-), 使得 

II A/ || <G(A) llxll 
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对所有的160：” 和成立 • 

证明： 设尸6从„是具有零主对角线的任一置换矩阵，例如 ， p = CaJ , 其中，如果）= 
*+1，或 i = w 且 ） =1，则 p ,, = l ; 否则， P „ = 0. 设 i • 表示 M „ 上由向量范数 1| • || 「通过 
(5.6. 1>]诱导的矩始 阵数. 在 At 上定义 (；（•） 为 

G(A> = Aii| + i | P i !| P J m max I a" |. 

显然， G (0 是上的向 M 范数 ， A I 对所有 A 6 M „ 成立，且 
, II Ar|| <|| A I IUII <G(A) IUH 

对所有 AeM „ 和所有成立.但是， 

G( PP T ) = G( / ) = If /1 + # P 6 j|! P r J = 1 + II P 11 P r I 

G ( P ) = P 

G ( P r ) = ||| P T I 

G ( PP T )> G ( P ) G ( P T ). 

因此，上的范数与 C 上给定的向 《 范数相容， 〖 ft ! 它不是次乘性范数. □ 

练习设 A 二考虑极大行和矩阵范数的下述 变更： 

!S a II S= H A + diag(a„ ,« 22 •• 

证明这是形如 （5.7.2>的 Hadamard 乘积范数， W 而它是上 的向嫩 范数.证明这个范数与 
C ” 上的向 M 范数 HU 相容.然后 i 十算 

II：:] WIC :]1 

并且证明这个范数不是次乘性范数. 

习 B 

1. 设 G (0 是上的向世范数，设 . vec " 是给定的非零 向址. 证明函数 

II J- II = Gixy 9 ) 

是 C " 上的内量范数.当 

y = [1，1，…， l] r sS.y = [1，0,0•…， O ] 7 

时，这个范数是什么？ 

2. 设 HI 是 A 1 上的仟意向 M 范数. 设46从„是给定的矩阵，且 € >0是给定的数.证明 

存在某个 K = A )>0, 使得 

0(A) - || <[>(A)+ e ]* 

对所有々:成立 • 

3. 设 Ml 是上的任意向減范数，且设是给定的矩阵. （ a > 利用习题2证明，如 
果 〆 A ><1， 则当々一 oo 时 || A * || — O . 它以什么速度收敛？ （ b ) 反过来，如果当 oo 时 
II A * 11—0,证明 〆 A ><1. 提示：如果九 r = A * r 且^•关0,考虑|| A *0 … t ] || • ( c ) 关于利用 
向 童范数 讨论矩阵幂级数的收敛性，你能说些什么？ 

4. 设0(0是/^„上给定的向唐范数， a 定义函数 C / : M ，— R 为 


G\B) = max G(BA). 

证明 G '(0 总是 上 的矩阵 范数. 证明总有 G '(/> = I . 如果 G(H = 1, 证明 
G ( B ) 对所有 BeM n 成立. 

以下四个习题是习题 4 的延伸. 

5. 如果 G 。） 是上的矩阵范数，证明对所有成立，并旦证明，如 
果 G (/) = ], 则 G '(*)= G (*). 

6. 证明总有 

7. 如果 （；（•） 是 M N 上的向 M 范数，且 GU ) = 1,证明 （；（•> 是矩阵范数，当且仅当 

(扪对所有 BeM „ 成立. 

8. 证明，在习题4中定义0'(0时，可以颠倒 A 与 B 出现的顺序，从而得到另一个矩阵 
范数.用例子说明，这另一个范数不一定等于 （)'（•>. 

9. 证明与 R 上一个给定的向 墩范数 相容的 C ” 上的所有向量申•范数组成的集合是• — 
实际上它是一个锥. 

10. 说明数值半径 r (0 不是 M •上的矩阵范数，试考察 （5. 7.4) 中的各矩阵且比较 r ( AB > 

与 r(A)r(B). 

11. 定理(5.6.9)中的不等式|為|||>^>\>可以由关于矩阵范数||卜1的次乘性公理 （4) 得出. 

但是，可能有这种情形， Mi 上的一个向》范数满足这个不等式（即它是谱优势 的）， 而它不是 
矩阵 范数. 证明 r ( A )^ o ( A > 对每个•成 立. £一般地，证明 a ( A > C = 彳 x •九 r : 1 

12. 证明上的向 M 范数 || • IU 在 C 上不可能有任何相容的 M 范数. 提示： 考虑 

_ 和 〆 九）.但足，证明” HI ■.是 上的矩阵范数， Wlfti 它在 C ” 上有相容向 ft 范数. 

13. 设 A = [〜]€■ M &,， 的第，行的转置用 r ,( A ) = [ a , i ， fl , 2 ，…， “„] 7 表示 ， fW A 的 

第 j 列用 q ( A > = 0, ; ， “,] 7 表示，乂假定 IhIL 和 HI # 分別是 c ” 和 cr 上的向最范 
数，然后， 定义 •• — R 为 

G,. a iA)= II [|| r,(A) ||. * II r 2 (A) lU".，|| r m (A) \\.Y || 

类似地，定义为 

G^(A)= || [ || r, (A) II” || r 2 (A) li〆"，|| cAA) \\ fi Y || .. 

证明，（& •(•) 和各上的向最范数，但 （？•#(•) 与不一定 相同. 注意这是在 
矩阵空间上定义向 ft 范数的 A 然方式. 

14- 试比较习题〗3中的（^•(•>与（5.6>节习题4中定义的范数|卜|1.,,并且用例子说明， 
即使饥=”(且 Ij - li . = HI ,)， 也不一定是 M „ 上的矩阵范数. 

15. 在习题13中，当 || - II . = II - Wz = Ihlk 时， G ^( •) 是什么范数？ （？•〃（•） 是什么范数？ 

16. 在习题13中，当 HL = HI •且 II - II , = IhIL 时， （&•(•) 是什么范数？ G ^(0 是什么 
范数？有什么关系？ 

17. :? VG (») 是上的向#范数，定义 G («) 的谱示性數为 

m(G) = max p(A) 
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证明， （；（•） 是谱优势的当且仅当 m ( G )< l . 然后证明， M „ 上的任一向董范数在乘上一个常数 
[其中最小常数一定是 m ( G >] 后可以变成一个谱优势 范数. 如果 m ( G ) = l ， 则称 M „ i 的范数 
G (0 为极小谱优势的. 

18. 证明，任何诱导矩阵范数是习题17中所定义的极小谱优势范数.说明有一些范数是 
极小谱优势范数但不是诱导范数.证明数值半径 KA) 是极小谱优势的. 

19. 证明谱示性数是由上的向 M 范数组成的锥上的凸函数 • W 而证明上的所有谱 
优势向《范数组成的集合是凸集. 

20. 证明，上的向 S 范数 (；（•> 是谱优势的，当且仅当对每个存在一个常数 q 
[只与 GO ) 和 A 有关]，使得对所有整数々>0,有 

G(A*) < r A G(A) k . 

21. ( a ) 证明，当 A 是正规矩阵时，数值半径「（•）适合 KA )= /0 ( A )=||| A ||| 2 , 但是一般 
r ( A )^||| A |. 给出一个关十矩阵 A 6 M , 的例子使得 KA )<| Afc . 提示： 证明当以云从是西 
矩阵时 KlTAL 0 = r ( A ), 然后利用 A 可两对角化的事实.冉说明一般地有 

r (/\) = max I x ' Ar |< max || Ax \\ 2 || x || 2 = || A 

I X L »1 i 

( b ) 证明，对所有都有 r ( A > = KI >• ( c > 按如下所述证明对所有 A 6 M " 都冇 |||A |< 
2r(A )： i[l 

A = ( A-h A 9 )/2 + (A — A . )/2 = A ,- hA 29 
并注意到 A 和/ \ 2 是正规矩阵.然后证明 

11^1 <：l A, |+||A t | = r(A t )+ r(A：)< r(A) + r(A' ) = 2r(A). 

( d ) 试考察适当的矩 M •，如 A :|」 和 J 说明 （ a ) 和 （ c ) 中治出的界 




( i ) 


足可以达到的. 

22. 试用习题 21( d ) 中的不等式以及定理 （5.7.11) 中给出的关于 r ( r > 的界证明，函数 4 KO 
是上的矩阵范数 • 试考察 A == H A •和 AA •，证明 cr ( r > = 4. 

23. 由习题 21( d ) 中的 （ i ) 以及 （5.6) 节习题23给出的不等式， 

-^11 A || 2 <|| A || 2 < II A || 2 ( ii ) 

试推出，对所有的不等式 

-^11 A || 2 < r ( A )< || A II , ( iii ) 

2v^ 


成立，并且证明其上界是可以达到的. ^ A= Lq 



和 A = J 分别给出了 （ i ) 和 （ ii ) 的下界中 
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等式成立的例子，然后验证 a=D =是 （ i ) 和 （ ii ) 的上界中等式成立的例子.由此说明，为什 

咖 么 （ iii ) 中的上界是可以达到的，而 （ iii > 中的下界不一定能 达到. 为什么对所有的 A 6 M „ 存在一 
个有限正常数 c ■使得 cjA || 2 < r ( A )? 实际上 • n 为偶数时。=(2«厂 1/2 ,而 n 为奇数时 c „ = 


(2 W — 对于偶数/ I ,相等的情形要求矩阵酉相似于形如 


KA) to >诸矩阵的直和 


当《为奇数时，矩阵的直和一定要附加一个丨 o ' 丨的被加单项 [ fl ], 且 | a | = r ( A ). 

24•证明 [ A , S ]= t r AiT 定义 R 上的一个内积，而 R 上的/ 2 范数可由 [• ， •] 导出； 
即 II A || 2 =0, A ?" 对所有 成立. 证明，如果 ： V = u •是秩1 Hermite 矩阵，则 
II ^11 2 = 11 x 1!!. 证明给定的矩阵的值域正好是 A 到范数为1的秩1 Hermite 矩阵的集 
合（关于内积 [• • •]> 的射影组成的集合，并且证明 r ( A ) = max { | [ A , X ] | : X 是秩 1 
Hermite 矩阵且 || X || 2 = 1}.利用 Cauchy-Schwarz 不等式证明 r ( A )< || A || 2 . 

25. 数值半径与自然通近 问题有联系. 设是给定的，并 fl 假定我们想在最小二乘 
方的意义下用•个秩为1的 Hermite 矩阵的纯量倍去尽可能地逼近如果记 X = 

C， II -r ll 2 = 1,试证明，另 r = [ A ， 且其中的单位向 tt S 可使 （5. 7.6) 中的极大值达到 
时，贝 IJ 


II A - X II ? = || A - cr * r . 诉 > || A ||| — 2 | c [ A ， xr .] | + | c | 2 
可以达到 极小. 由此断£，所有纯 M r 以及所有具有 || X || 2 = 1的秩1 Hermite 矩阵, 
II A — cX || 2 可以达到极小，则丨 （* ! -- r ( A ). 

26. 前面两个习题引出 了数饩 屮以和值域的一个 ft 然 推广. 设 0 CA 1 是一个非空的矩阵 
集合，且适合以下 条件： * 

( a > 若；则灰所冇 “tC 有 • 

( b > 对所有 有 〔 A , X ] = tr AX ，=0 当 R 仅当 A = 0, 

( c ) 0 是一个闭集 
若定义 


"3321 


• HA ) = max 


I [ A » X ] I = max I tr AX * |. 
■ xi<i 


说明 >(•> 是有意义的，它是 M . 上的向量范数，且满足丨 HA ) | < || A || 2 . 证明对每个 
都存在某个使得1| 2 = 1且多 ( A >= 丨 [ A , X .,] I . 

考虑用0中的矩阵去逼近给定的矩阵即求某个使得||焱一久|| 2 达到极 
小. 证明，矩阵给出了一 个敢佳 逼近，其中 MA >=|[/\， X . A ] I ,并且用任意 


逼近 A 的误差有 M 大下界 || A - X \\\^\\ A \\\- i [ A , X A -] | 2 >0. 


证明，若 0 是由秩 1 Hermite 矩阵的所有纯量倍组成的集合，则#(為> = r ( A ). 在少是酉 
矩阵的所有纯 M 倍的集合的情形将在例 （7. 4. 6) 中 讨论； 在这种情形下彡 ( A > 是 A 的各奇异值的 
平 均值. 另一个值得注意的情形是少是所有奇异矩阵的集合，这将在例 （7.4. 1) 中讨论，在这 
种情形下彡 （ A ) 是 A 的最小奇异值.还有一个值得注意的情形是，秩是已知的正定矩阵、 
Ilermite 矩阵或正规矩阵的所有纯鲎倍的集合，或者是由酉相似于一个给定的矩阵的所有矩阵 
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的所有纯量倍组成的集合.在上述每一种情形，与值域类似的是集合 {[ A ， X ] * X 6< D }. 

27. 即使数值半径 KA ) 不是矩阵范数，但对所有 m == l ， 2,…和所有 AGA ^， 它的确满 
足幂不等式 KA -)<[ r ( A )]", 试按以下步骤证明这个结论. 

( a > 说明只要证明下述结论就足 够了： 若 KA )<1, 则对所有 m = l ， 2,…有 r ( A M )< l . 

设是给定的正整数，转到余下的论证，设表示 m 次单位根的集合， 

注意到 } 是一个有限乘法群，并旦对每个）= 1，2 •…， m 有= {uv 

( b ) 说明 

Kl 

l — Z M = JJ (1 — W k z) t 

然后证明，对所有有 

/ >(2) 三丄公 JJ (1 — U »* z ) = 1. 

提示： 注意到 />( Z ) 是次数至多为 / W —]的多项 ^ •且 

= 丄 

w 1 一 vj,z 

对所有 «6 C 都有 /因而广(2：> =常数=;>(0> = 1. 

( c ) 证明 

19% m m 

/ — A " = IJ (/ — u^U 和 / = 丄乞 打（/一 如八). 

( d ) 设^€0 •是任一申•位向 M , || j -|| 2 = K 乂设 A 6 M ,. 验证 [3331 

l-s'A-x= x # (/-A-)x = Ux)'(I-A-)x 

1 k*j 4-1 

1 ** _ 

=— S ? / [d — io f A ) zJ f Z , S Jl(I — w t A)x 

*-• I 

L *， lli [ 1_ w ，( ltll ；)、( T ^ T 7)]. 

r,*U 

( e ) 现在在 （ d ) 的恒等式中用， A 代替 A , 便得到对任意实数沒有 

1 ^±11, 卟-〜 (点)、(命)} 

然后假定 K ^ U <1， 证明这个恒等式右边的实部对任意是非负的，由此推出左边的 
实部对所有 (96 R 也一定是非 负的. 由于夕是仟意的，证明这蕴涵丨 | <1,因而 K / V ") 

< 1 . 

28 - 即使数值半径满足幂不等式但它对不等式 r ( A *^)< r ( A *> r ( A ") 不 
总成立.试通过考察 A = J ,(0)(4 X 4 Jordan 块矩阵 》 ，6 = 1和 w = 2来验证这一事实. 提示： 
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利用算术几何平均值不等式证明， r ( A 2 )= r ( A 3 ) = y , 然后用 C ' auchy - Schwarz 不等式证明 
r ( A )< l . 

29. 类似于极小矩阵范数概念 （5. 6. 29)，试问在 iVt 上存在关于“极小向量范数”的合理概 
念吗？ 

进一步阅读 关于涉及数值半径的不等式的进一步讨论可参看 M . Goldberg and 
I . Tadmor，“（）n the Numerical Radius and Its Applications /* Lin . Alg . Appl . 42 ( 1982)， 
263-284. 习题 27 中关于数值半径的幂不等式的证明取 fl C . Pearcy , “An Elementary Proof of 
the Power Inequality for the Numerical Radius/’Michigan Math . J • 13(1966)，289-291. 本节 

參 

某些内容是本书作者的研究成果， SI 参看 C \ R . Johnson , “Multiplicativity and Compatibility of 
Generalized Matrix Norms ，” Linear Al ^. Appl . 16 ( 1977 ), 25-37，** Locally Compatible 
|334 l Generalized Matrix Norms /* Numer . Math . 27 ( 1977〉，391-394 ，“Power Inequalities and 
Spectral Dominance of Generalized Matrix Linear Appl . 28(1979), 117-130， 其 

中还有其他的结果. 


5.8 矩阵的逆和线性方程组的解的误差 


作为矩阵范数和向范数的应用，我们来佔计在求轵阵的逆和求线性方程绀的解的过程中 
所引起的误差. 

如果给定了非奇异矩阵可以设想能够准确地计算出逆矩阵但是，如果计 
算是 A : 数字计箅机上用有限长的计算机字符来完成，则不可避免地要出现舍人误差和舍位误 
差.另外，即使能十分准确地完成所冇 计算， 似可能冇这种悄形，矩阵 A 的有些元家是某些 
实验的结果或某些必然会出现误差的计算结果，因此，就不可能 t •分精确地知道这些结果.那 
么，汁算中的误差和数据中的误差如何影响要计算的逆矩阵呢？ 

对了 - il ••多 0 K 通的算法，可以证明，在计算中的舍人误差可以用 N —种方式模拟成数据中的 
误差. 也就是说，如果假定 A 6 M ， 是给定的非奇异矩阵，并且想计算/\ \而实际计算的可 
能是其中是足够小的矩阵，且使 A + E ： 为可逆 矩阵. 于是，误差是 / T 1 一 
( A ^- E ) *. 如果 〆 m < l , 则 A + E 就是可逆矩阵，且我们可以 

把 （/ + A T 厂 1 写成 A •£： 的幂级数.这就给出 

一 M + Er 1 = A " 1 - 2(一 1)*(八 l E) k A l = X )(- l) … M 广 A 1 . 

W 此，关十这个误差的枏确 公式： 


A * -( A 4- E ) -* = X )(— 1 广 "（A 如果 〆 A -*£：) < 1. (5. 8. 1) 

现在假定 IH 湛给定的矩阵范数，且假定彳|>\-*尺11<1， W 而特別有 〆 A 」£：><1和 （ 5 .8. 1) 
成立.于是 


I A" 1 -(A-f E) 丨卜读 (- 1 A 」 E)*A- 
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由此得出，求逆过程中所引起的相对误差的一个上界是 

則 如 •- ^ 1 . <5 - 8 - 2) 

另外，如果让/*:足够“小”，以至 hlCl / llAl , 则 〆 A 'EXIfA 1 E IK ! A 'I ||| E !||<1, 
FI 有估计式 


数 


A-»-(,\4-E) ' 1! I AM IK] = , A-lt ；1 A ,i( E ； 1/| A ； l) 

!M—，III 、 i —M ， I; ㈤ ： i-|| A~ v i il'AidiEii/Mi)* 




如果 A 是非奇异矩阵； 
如果 A 是奇异矩阵 v 


(5.8.3) 


称为矩阵逆关于能阵范教 | • || 的条彳 f 教. 注意 W A > = i A 1 ||i I A ||>|| A - 1 A 卜 I /1 对任意矩 
阵范数都成*. 

利用这个记蜉，有佔计/: 


!|A •- 

(A + E ： 1 '| 


1 ■ ■ ?i* 

ml 


^ Hi 如则 " |A i < 1 ， 


(5.8.4) 


它用数据的相对误差丧示矩阵逆的相对误差的界.对小的 iEfl , 右边为数 M 级 ； c ( A );| f 〕||/|||/ V ||， 
所以有充足的理由相信，只要 / c ( A > 不很大， 矩阵逆 的相对误差与数据的相对误差就为同一个 
数 M 级，为了求逆的实际需要，如果较大，称 A (关于矩阵范数 || • |||>为病态的或坏条件 
的：如果较小（接近于 1), 就称 A (关于矩阵范数 iHl ) 为良 态的； 如采^(4)=丨，就称/\ 
(关于范数 1* ||)为优态的. 

在采用的范数是谱范数的普通悄形，条件数有一个有趣的几何 特征. 设 WA ) 表示当 a * 和 
y 取遍所有正交 甲位向 M 偶时向墩 Aj •与 Ay 间的最 小角. 利用蹐范数， K ( A ) = cot [^( A )/2]. 
W 此，若 A 是酉矩阵，则汛 A > = tt /2 H . cot (7 r /4) = l = ic ( A ). 若 A “近乎奇异矩阵”，则有某个 
正交单位向设偶 X ，. V ,使得九 r “儿乎平行”于扒 A ) 就会很小，而 # cM > = cot [外 A )/2] 就 
会很大.欲知详悄，请 参看例 （7. 4. 26). 

练习证明，如果 A 6 M , 可逆， • 

练习证明，如果【八是酉矩阵，且采用谱范数（或者任何其他西不变范数），则 
K ( A )= k ( UA )= k ( AV )= k ( UAV ). 因此，一个给定矩阵的 两变换 不会使它比原有的性态更加 
病态. 这个论断为许多稳定数值线性代数算法奠定了基础. 

练习证明总有•/ c ( •) 是从上的矩阵范数或向 M 范数吗？ 

利用上述这些条件同样可以对线件方程组解的铕确性给出先验的界.假定希望解方程组 

.4 r = 6, A 6 M n , 6 6 C " (5. 8.5) 

但是，因为计算上的误差或数据不精确，实际上是解方程组 
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(A 4- E ) j = A * A .E 6 , b ^ C ". 


(5. 8. 6) 
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关于误差 x — i , 可以说些什么呢？ 

如果£足够“小”，使得 〆 A ，£：><1， 則根据 （5.8.1) 有 
s - i = A l b -( A ^ Er l b = [A • — ( A-f 

.V) OC? 

如果 III • 1 是矩阵范数，且 |A 乂如果 Ml 是相容向*范数，则关于误差的范数的上 

界是 


iix-iii《gifuriuii = 11 J 11 • 

关于相对误差，这说明，如果 ||A l E\\<\ 9 且 Ml 是与矩阵范数|| ^11相容的矩阵范数，则 

• JU-—ill 〈 JA AI 

iuii ^ \ -\i a i e f ⑽. 7 ) 

值得注意的是，这与关于矩阵逆的相对误差的上界（5.8.2>是相同的，且与线性方程组的右边 
办无关. 

利用 /V 的条件数，用来推导（5.8.4>的证明同样可以证明，如果以^/：||<1，且向 M 范 

数 HI 与矩阵范数 HI 相容 • 则 （5. 8.5) 的解的相对误差有界 

」U — i || 〆 ^( A ) |£|| 

II xii 、 i-/cM)(im 轉 ) 

无论采用什么算法来解线性方程组 （5. 8. 5), 它的解的相对误差与其系数矩阵的逆的相对误差 
有相同的界. 

像标准线性方程组 （5.8.5) 的系数矩阵 A 的元家一样，它的右边 A 的元索也可能产生误差， 
影响方程组的解，于是想用 

(A + E ) i = b-\-e (5. 8.9) 

代替 （5. 8. 6), 其中 £：€ M ， 和看成是“小”的数据 误差. 

采用相同的方法，在关于（5.8.8> 的相同假设下，（如果6关 0) 求得（5.8.5> 的解与 （5.8.9) 
的解之间的相对误差为 


I J • 


(5. 8. 7) 


(5. 8. 8) 


II x - i -|| 


k (.A) 




# c ( A ) 


lie 


IMI ^ l -/ c ( A )( i | £：|/||； A H > i | A ||r 1 -^( A)(||i E || l /||； A |) II b jj (5. 8. 10) 

这样，相对误差界有两项，一项是关于系数矩阵 A 的相对误差界， 一 项是关于右边的相对误 
差界. 在确定关于解误差的界对数据误差的界的灵敏度方面，条件数 / c ( A ) 仍然起着决定性的 
作用. 

至此，我们的所有估计式都有一个先验的误 差界； 它们不涉及所计算出的解或者由它导出 
的任何 M . 但是，假定通过计算已经求出方程组（5.8.5>的某个“解”: r . 恰好有 Ai = 6 的情形 
往往是不可能的，不过，可 以从利 余向量 — Af 得到 i 与真解 a •如何接近的估计式.因为 
A -« r = A - , [6- Ai ] = A = 所以有简明的界 | U_x || < || A ， 1 HI ■ 如果 || • || 是与 
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向董范数 IM 相容的矩阵范数，则我们有 1|6|| = ||為1||<|||八|||1||， 或者当6关0时，1< 
||| A ||| IUII / H 6 H ，因而 

|| a- - x || < I A- I l|r|| < II A''ll IMI = ㈤ III ■ 1 ||借 |U || . 

因此，如果6关0,计算出的 i •(适合 Ai =6 — r ) 与真解 a •(适合人 r == A > 间的相对误差有界 

II J ~ ^ 11 < ^(A) II r 11 (S K 11) 

lull <IC<A) liTT ， (5.8.11’ 

其中，假定用来计算条件数 HA ) 的矩阵范数是与向 M 范数 Ml 相容的.对于良态问题，解的 
相对误差不会比剩余向童的相对大小(更）坏：对于病态问题，即使计算出的解产生一个小的剩 
余向量，它仍然可能与真解相差很大. 

关于误差的范数估计的敁后一个注释，我们指出，本节所导出的各个上界仅仅是上界而 
已. 尽管上界可能很大，但是实际误差仍然可能很小.这些界的一个共同特征是它们的保守 
性：它们给出的误差界对许多问题未免太笼统了.但是，如果一个有适当阶数的矩阵 A 具有 
适当大小的各元索， ft 有较大的条件数，则 A 1 —定有某些大元素，于是，对下述理由多加考 
虑是有益的. 

如采 = 幻且令 C =[ q ] 兰 A ' 那么，关于元~微分恒等式 i = 便得恒等式 

音 = <*«；• 1,> = — (5.8.12) 

另外，把 C = A M ft 成 A 的函数，則它的各元只是 A 的各元的有理函数，因而可微.恒等 
式 C /\ = / 表明，对所有/, …，„，有 

m 

= 必， 


1，2,…, 


(5. 8. 12) 


因而 
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2 =- 占 〆•” | ， ) ，々 = 1 ，•••，”• 


现在关于“微分恒等式1 = 0^使得 


它是恒等式 






(5. 8. 13) 


因此， （5.8. 12) 和 （5.8. 13) 同时提醒我们，如果0=八^有相对大的任意元素，则解; r 的 
某个元素对6和 A 的某些元素的扰动就可能有难以避免的较大灵敏度. 
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习题 


1. 证明非奇异正规矩阵的逆关于谱范数的条件数是 

/ c ( A ) = p ( A ) p(A l ) =| X tnt AA )/ X m AA ) |. 

2. 求矩阵 

a 1 一 1 1 

A = ， e 〉0 

L-i i + e 」 

'的特征值和逆矩阵 • 证明，当时， A 的最大特征值 与最小 特征值之比为数量级 e - 1 . 试用 
习题1证明，关于谱范数有 / c ( A >= OU ^. 证明，关于任意范数有因而对于 
求逆来说， A 是病 态的. 试用 A 1的显示形式证明，对任何范数有 〆 4)=0(^). 

3. 求矩阵 

-[: 二] ，… 

的特征值和逆 矩阵. 证明，当€—0时，《的《大特征值与最小特征值之比为数谕级 1. 但是证 
明，关于任何矩阵范数有 / f ( Zi ) = ( X € 1 >• 囚而当 fO 时，对于求逆来说， B 是病态的.由此 
可知， ft 大模特征值与 ft 小模特征值之比不一定是非正规矩阵的条件数. 

七矩阵逆的条件数 / c (. A ) 依赖于所采用的矩阵范数，但是可以证明，所有条件数在下述意 
义下是等 价的： t \\^ K a ( A)^A '||L 且产 k 则存在有正常数 C 、《 C M 使 

得 

O .( A ) <々( A ) < C m / c .( A ) 

对所有成立. 

5. 证明，关于 谘范数 • 每个西轵阵 I ；对 f 求逆是优态的 0(10 = 1]. 但是，如果采用/ 2 
范数，每个内矩阵的条件数<((；>是 w . 

6. 证明，对任意非夺异矩阵 A 6 M . 和任意矩阵范数有 WA 〉》 U ( A >|_/ | A ( A )|_ 
( max 和 min 在这种情形是指特征值的极大模和极小 模）. 因此，如果这个特征值的比是大的， 
则该矩阵对于求逆一定是病态的，而不管它是否为正规 矩阵. 但是习题3说明，如果矩阵不是 

[3401 正规阵，即使这个比不大，它仍可能是病态的. 

7. 试对界 （5.8.8) 的推广（5.8.10〉给出详细证明，当 e = 0 时，界 （ 5. 8. 10 ) 就简化成 
(5. 8. 8). 

8 - 设 I 是 C ” 中的单位向设，且设 A >0, 证明•是 Hermite 矩阵，且有（《— 1 ) 
歌 特征值1和特征值 1+ A . 证明 • WA > = 1+ A (关于谱范数），于是，这给出了产生可逆矩阵 
的简单方法，且使该矩阵具有有界元素和任意大的条件数.为什么？ 

9 - 设《是习题3中的矩阵，考虑具有精确解 i = [ l , 0] r 的线性方程组^1 =。， ip 及其 
近似解}三 [ l+ e ' c ,2 ] r . 证明，当 € — 0 时； 剩余向 M 的相对误差为 || r || / || 6 || = 
OV 2 >— 0;但是，当时，解的相对误差为 | U - i ||/|| i || = 0( e -，4 oo . 这样，有大 
误差的近似解可以产生小的剩余向 M . 试用界 （5. 8. 11) 来说明. 

10. 如果 det A 是小的（或大 的）， / c ( A ) 就一定大吗？ 提示： 考虑 A = A /6 M n . 
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11. -般 •（5.8.4) 的结果比（5.8.2>的要弱，这是因为假设条件 ||! A 」 fi | E |||< l 比 |! A _ l E || 

<1有更强的限制.不过，即使较强的假设条件被满足， （5.8.2) 仍然可以给出比 （5.8.4) 较好 
的 上界. 试用0<€<1,作出说明. 

12. 如果方程 （5. 8.5) 和 （5. 8. 6) 用 

AX = B 和 (A + E ) X = B 

来代替，其中， A , E 6 M „ ,而；^ 求关于界 （5. 8. 7) 和 （5. 8. 8> 的类似界.考虑走= 

w 和 B = J 的特殊情形：这有助于“说明”为什么 （5. 8. 2>中与 （5. 8. 7>中的上界是相同的吗？ 

13. 我们已经导出的矩阵逆的误差的各个界都依赖于 （5.8. 1>,它要 求 〆 / \ iEX ]. 证 
明，如果 A 和 A + E 都是可逆矩阵，则不论 A 的阶数如何， 

IA 1 - (A + E) 1 | < 1| /\ 1 || |||( A + E)- 11 E|| 

对任何矩阵范数 HI 都 成立.提示： 证明 /\ M—(A + E ) '-(. A - i - E ) l EA \ 

H . 或许被引用得 M 多的病态矩阵的例子娃用\ = — 定义的 Hilbert 矩阵 H N = 

C ^>] eM ri . 证明关于谱范数的条件数是用 I A _/ A m , n I 给 出的. 其亊实是仏的条件数是_ 
渐近地等于，，其中常数 f 大约是 3.5, 另一个步实是当”一 co 时 〆 Hjsir + Otl/nog W )]. 

我们有 〆 〜 5 X 10 2 , (/〜 1.5 X 10 7 和 / c ( H h > 〜 1.5 X 10 | U . 说明，即使//,的各元都一 

致有界不是很大，为什么还是坏条 件的. 

15. 如果采用进范数，证明 / c(/V A )=/ c (.4 /V > = L / c ( A >] 2 . 试说明 • 为什么采用数值方法 

解 A ' = y 的问题可能不会比解 A«r = : r 的问独真正来得容易. 

16. 设紙是非奇异 矩阵. 试用 （5. 6> 节37独中的不等式证明 ||/||| A — B |对 
任一舒异矩阵 成立. 这里 I . I 1 是仟一矩阵范数，而 <(•> 是相应的条件数.这个下界可 
以用来证明一个给定矩阵 A 是病态的. 

17. 设 A = 是所有 a •关0的上三角矩阵.试用习题16证明关于极大行和范数的 

条件数有 F 界 



进一步《读 在 性方程组时求误差的先验界的问题已是数值线性代数的一个中心问 
题； 见 Oel . 


MI 






第 6 章特征值的估计和扰动 


6.0 导引 


对角矩阵的特征值是很容易确定的，并且矩阵的特征值是其诸元素的连续函数，于是，我 
们自然要问，如果矩阵的非对角元相对于主对角元是“小”的，那么，关于它的特征值，我们是 
否能够说出任何有用的结果来.这样的矩阵的确在实际中出现；由数值离敗化椭圆型偏微分方 
程的边值问题得来的大线忡方稈组就可能有这种形式. 

在某些涉及一个振动系统的长期稳定性的微分方程问 题中， 人们感兴趣的往往是要证明一 
个矩阵的所有特征值都位于左半平面内 • 即 Re ( A ,)<0. 而在统计学或数值分析中，人们有时 
需要证明 Hermite 矩阵是正定的，即所有 A ,>0. 

有时我们想在一个容易刻化的有界集上估计一个矩阵的特征值.我们知道，矩阵 A 的所 
有特征值都位于复平面上中心在原点，半径为 i ; A | f 的圆盘中，其中 || «|是任意矩阵范数.然而， 

能否用更准确的估计区域做出比这 更好的 估计，使得该区域肯定包含或不包含这些特征值呢？ 

我们将会看到，这是能够做到的. 

M 后，假定确实知道 A 的各特征值 • 乂假定 A 必然会产生扰动 A—A + E . 这时，特征值 
如何变化呢？因为 A 的特征值是 A 的各元的连续函数 • 所以有理由相信，如果扰动矩阵 E 有 [343 
-•个足够小的变化，则特征值不会有太大的 变化. fti 是需贽有准确的界限，以便知道在每种悄 
形下怎样小才是所谓的“ 小”. 这里的基本问题与 （5. 8) 竹中相同，在那里 • 我们讨论了线件方 
程组的解对数据扰动的灵敏度. • 

6. 1 Gersgorin 圆盘 

如果 AeR ， 总可以把 A 写成 A = D 十丄其中 ， D = diag ( ti „， …， 正好是 A 的主对 
角部分，而 B 有零主对角线.如果对任意 e ec , 令人 则々《> = £)，而 A 0 = 

D 的特征值是容易确 定的： 它们恰好是 甲面 中的点我们有理由推测，如果 € 

足够小，则 A , 的特征值将位于点…， ，…，〜 的某些小的邻 域中.卜述 定理（常称为 Cierigorin 
圆盘定理）使这个论断更为 明确： 确实存在某些 以点心 为中心的容易计算的圆盘，它们肯定包 
含诸特征值. 

6. 1. 1 定理 （ Gersgorin ) 设 A = [ a ,, 16 M , • 又设 

縛 

R \{ A ) = 2丨 | , 1 ^ i ^ /I 

i*l 

表示 A 的各 去心绝对行和 .则 A 的所有特征值都位于 7 i 个圆盘的并 

n 

U 6 c ： I ^ - ( A )}= CXA ) (6. 1 . 2 ) 

t -1 

中. 此外，如果这《个圆盘中有々个之并形成一个连通区域，且它与所有余下的《 — 4个圆盘 
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都不 相交. 则在这个区域中恰好有 A 的々个特征值. 

证明： 设 A 是 A 的特征值，且假定 Ar = A * r ， 爹 0. : r 有一个元素具有最大的绝对 
值，例如，对所有/=1, 2，…，《， I 丨 > 丨 a 丨，且巧关 0. 于是 Aj *= A * r 的假定说明 

縳 

人 O = [A-r], = [Ar]^ = 

它等价于 ，_， 

Mil x p (X — a pp ) = 


另一 方面. 三角不等式使我们得出， 





< 2 I “ 〆 ， 丨= 2丨％丨丨 a 



<1 I 2 I I = I ^ I K- 

i^p 

w 而，对某个 p , u ，|<圮：即 a 位于中心为半径为化的闭圆 盘中. 因为不知道 
哪个适合每个特征值非知道相应的特征向 S , 要是这样，我们就准确地知道了 h 况且 
可能对确定 A 不感兴 趣）， 所以只能得出 • ，\位于所有这些圆盘的并中，它就是区域 （6. 1.2). 

为了证明 i? 理的第二个沦断， i 己 A = G + «, 其中 D=di a g( fl „, …， ‘ ），且令 A.eD + 
eB. 注意， K ： (A.) = /? ： uB) = c^ ； (A). 为方便起见，假定前々个岡盘 

k 

U ue c:| J — “ r iv R ：) 

f l 

形成连通 g 域（人， El : 与余下的”一 + AWIfit 组成的补区域 Gi 不相交，即 Gi = G ( A )\ C ；*. 值 
得指出的是，对所有 e 6 [0, i ] A , 的前* tWI 盘的并 

身 

G*(e) -(J {zect \ z-a a R ： iA.) = eR ： (A)) 

I - I 

包贪在连通集 , 不过，对所有这样的 e . G *( e ) 可能本身不是连通集.另外，补 K 
域 Gi ⑺三 (人( £ )\(；,(£)中&有一个与 G * 相交. 对于每个,=1, •••• 々•考虑特征值 a ,( A u ) = 
…以及 A , (人）， e 〉0 •因为特征值是 A 诸元的连续函数（见附录1)>,又 W 为对所有 e e [0, 1] 都有 
A ,( A ,)€ G *(6) eG *. 所以每个 A :( A y ) 通过 G * 中由认（人 >: 0< e < l } 给出的连续曲线与某个人 
(/ U - A . M ) 相 连结. 对于每个 e €[0, 1], 得知，汴中至少包含 A , 的々个特征值.但 
是， G *( e ) 中 A , 的特征值乂不会多于々个，这是因为， 戍 的其余 / I 一々个特征值作为一些连续 
曲线的起点落在连通集 G * 以外，而其终点疴定在补 K 域 Gi 内； 因为连续性和连通性（这是关 
于连续函数的中间值定理），它们不可能跳越 Gi 与 G * 之间的 空隙. □ 

(6. 1.2) 中的区域 G ( A > 常常称为 A 的（关于行的} Gedgorin 区域； G ( A ) 中的各个圆盘称 
[345] 为 GerAgorin 圆盘，且这些圆盘的边界称为 Gedgorin 圓. 因为 A 和 A 7 有相同的特征值，为 
了得到用去心绝对列和 


C ^( A ) = ^ i a，i I 
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描述的 a 包含 A 的各特征值的 区域. 可以把 Gei ^ gorixi 圆盘定理应用于 A T ， 得到关于列的 
Gersgorin 圆盘定理. 

6. 1.3 推论如果/\ = 则 A 的所有特征值都位于 n 个圆盘的并 

m 

U ue c*i z — ci，, iOg(a t > (6 .i.4) 

i-I 

中. 此外，如果这些圆盘中的▲个之并形成一个连通 K 域，且与所有其余 n — 々个圆盘不相交， 
则在这个 区域内 恰好有 A 的々个特征值. 

练习证明，的所有特征值都位于区域 （6. 1.2) 和 （6. 1.4) 的夂中，也就是说，它们位于 
门 G ( A T ) 中. 试用 fi ■有〜 = i 7 V 的 3 X 3 矩阵[^]来 说明. 

W 为 A 的所有特征值都位于 （6. 1.2> 和 （6. 1.4) 这两个区域中，所以 A 的最大模特征值也 
在 其中. 在 （〕( A ) 的第/个圆盘中，离原点最远的点冇模 

| £!• |+尺:=^ | | ， 

因而这些值的最大者一定是 A 的最大模特征值的一个 上界. 当然，类似的论述也可对绝对列 
和作出. 

6.1.5 推论如果 A = •，则 

_ m 

^ min {max ^ I ci^ I « max^] | a„ I }. 

/-I > *-i 

这个结论是我们意料之中的，因为它是说 • 和 jijA r |..( 极大绝对行和范数和 

极大绝对列和范数 >• 且这个不等式对任意矩阵范数 成立. 但是，有趣的是，这个结论冇一个 
本质的儿何推论. 

因为只要 S 是可逆矩阵 • S 与 A 就有相 同的特 征值，所以可以把 Gedgorin 定理应用 
于 S ^ AS : 也许对 S 的某个选择，所得到的界可能更 准确. 一个特别方便的选择是 S=D = 
diag (/»,, p 2 , p n )， 其中所有 p ,>0. 容易算出 • D 1 AD = lp,a 0 / p , }. 把 GerSgorin 定理 
应用于 D ' AD 和它的转置便得到下面的推论. 

6.1.6 推论 = 且设/»,, />”•••• 么是正实数.则 A 的所有特征值位于区域 

U 卜 € C : | d " i ci t> I 1= G(D l AD ) 

•-I 1 P > , r \ ) 

中，间时也位于 M 域 … 

U 卜 € C :| z — ％ |< / >>2 ★ I A I j= G[(D 'AD) r ] 

中. ’勺 

矩阵 A== D 2 有特征值 1 和 2. 直接应用 Gersgorin 定理只给出特征值的一个相当粗略 

/ 

的估计（图 6. L 7 a )， 而后一个论断中的备用参数却为得到特征值的一个令人满意的估计提供 
了很大的灵活性（图 6. 1.7 b ). 




34T 


练习考虑矩阵 


一 16 


A = - 16 


试用 Gedgorm 定理估计一下 A 的特征偾以及 A 的濟半径.然后考虑 D ^ AD , 其中 ， D = 
diag(/»M pzs / > 3 ). 并且在你的特征值估计中,#一《能否作出什么改进， 班后, 计算出实际 
的特征值，试对你所作估计的好坏给一个 if •价. 

练习 证明， A 的每个特征值位于«合门,/；(£) 其中交取遍只具有正主对角元 

的所有对角矩阵. 

我们也可以利用引进 ft 由参数的思想得到关 fiR 半径估汁（6. 1.5> 的更一般的形式. 


6 . 1.8 推论设/ \ = [^] eM w •则 

p(A) ^ 


=命 U 


p ( A ) < min max ^ | c /,. |. 


练习证明推论 （6. 1.8). 


» 习设4=匕 3] •其中〜 <.和 c / 恒•为实 i 下数. 


( a ) 用直接计算求出一个具体的对角矩阵 6. 使得 i||S '.4 D |. = min„|D ] AD\l 9 其中 
极小取遍只具有正主对角元的所有对角矩阵. 

( b ) 计算 ID - Wfiif . 

( c ) 直接 计算 〆 / U . 

( d ) 指出 r = p ( A ). 

以后将证明，如果 A 是任意一个 W X W 止矩阵（或更一般地为不可约矩阵和非负矩阵 >，则 
D 的极大行和仵所有 D 上取极小一定等于谱 半径. 这对一般情形不成立. 
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结习考虑 C .5 :]，㈣ ，对具有正…:的所有 D=diag(/»i , pz、 ， pi AX 
min|D ' AD |.. 

如果有关于一个矩阵的某些附加 信息， 它要求特征值位于（或不位于）某驾集合中，那么. 

可以利用这个信息以及 Gedgorin 定理给出特征值的更为准确的估计.例如 • 如果 A 是_ 
Hermite 矩阵，则 A 的特征值一定 都是实 的 • 因而它们一定位于集 R 门 G ( A >中，它是实闭区 
间的有限并. 

练习关于斜 Herniiu * 矩阵的特征值的佔计你能说些什么？关于两矩阵呢？关于实正交矩 
阵呢？ 

因为一个矩阵是可逆的当且仅当0不是其特 征值. 所以 • 值得研究的是导出从包含特征值 
的已知 区域 中去掉原点的条件. 

6.1.9 定义设矩阵 A 称为 对角占优的，是指 

丨“ • ！i: 2丨丨=尺： 

/-I 

对所冇 /= i •…，” 成立. 作 a 为严 n 对名占优的 • 是指 

«• 

I 1> ! fr, I = R\ 

对所有…，” 成立. 

从位 H 儿何学 可知， 如果 A 严格角占优的，0不可能位 f •任何闭 Gc ^ gorin 则盘 中. 

只外，如果所有主对角元 “,, 都是正实数，则每个岡盘实际丄位于幵冇半 ffij 内； 如果/\还是 
Hermit 矩阵，则特征值一定都是正数.把这些论断总结为下述定理 • 其中 U ) 部分称为 Levy - 
Desplangues 定理 [ 见推论 （5. 6. 17)]. 

6.1.10 定理设 A = 足严格对角占优的•耶么 

( a ) A 是可逆矩阵. 

<»>) 如果 A 的所有主对角元都是正数，则的所有特征值都冇正 实部. 

( c > 如果 A 是 HermiteSi 阵. R 的所有上对角元都是正数 • 则 A 的所有特征值都挞正 
实数. 

练习考察」3和 fl 丄 e :，说明仅有对角占优性质还不足以确保可 逆性， 并 fl 说明 

严格对角占优性对可逆性不是必要条件. _ 

利用推论 （6. 1. 6>的格用参数，作为可逆性的充分条件的严格对角占优性假设可以稍微放 
宽一 性. 

6.1. U 定理设 A 的所有对角元非零， RA 是对角占优的，乂除了 , = i •… ，” 

的一个值以外，对所有其他的值有丨“■丨 •则 A 是可逆矩阵. 

证明： 假设条件是说•对某个 h 丨〜丨=%， ft 对所有丨 >/?:• 在 （6.1.6) 




中，对所有设= 且设 P *= l +“ €>0. 于是，对任意£>0, 


且对所有 i ^ k ,. 


I 1= Y^Tl R，k <i 1 


"T I a 'i I = ^ 

* }i >"l 


但是，因为 R '< I 〜 I 对所有|关々成立，所以选择充分小的 e >0, 使得尺 '+£ I ^ I < U u I 
对所有/关々 成立. 因此，根据推论（6.1.6〉，点 z = 0 在 C ^ D ^ AD ) 之外，因而 A 必定是可逆 
矩阵. □ 

Gedgoriii 定理及其各种变形给出了 A 的特征值的各种包含区域，这些区域只依赖于 A 的 
诸主对角元以及各非主对角元的绝对值.利用与 A 有相同的特征值的事实，可以得出 
(6. 1.6), 并且得出闭集 


厂] G(D 1 AD ), D = diag (/>, ，… •/>■)， 所有 />, > 0 


( 6 . 1 . 12 ) 


包含/的所有特征值的 结论. 我们知道，如果可以采用比对角相似更复杂的相似，就有 
可能得到包含特征值的更小的 K 域，但是，如果只局限于对角 相似. 并且只限于利用主对角元 
以及非对角元的绝 对值. 能否设法得到比 （6. 1. 12) 更好的估计呢？ 

间答是否定的 • 其理由如下：设2是集合 （6. 1. 12) 的边界上任一给定的点.耶么， R . 
V flrgfl 已经证明，存在矩阵 《 = [>•,]€ M W , 使得对所有*=1,…，”有而对所有 I， j 
= 】，•••， n 有丨\丨= U , 丨，并且 z 是 B 的特征值. 

习睡 

1. 考虑”X”线性方程组九 r^jy, 其中 A 和:V是给定的： 

(i ) 定义 BE/ — A, 然后把原方程组改写成 •rsBT+ jy . 

( II ) 按你所窬要的任一方式选择舻的初始逼近 x ‘°’. 

( iii ) 对 m = 0， 1, 2 ,…， Ifn x im ^ l) = Bx , m > ^ y . 

(IV) 可以指窀， 当所 时， a (解） • 

( a ) 试用，一 . r 永示第次逼近与解的误差，并且证明 ( b ) 证 
明，如果 〆 / 一 A ><1， 则不论初始逼近 y u > 如何选择，在 w — oo 时 I 的意义下这个算法 
总是可 行的. （ c ) 试用 Gersgorin 定理给出关于 A 的一个简单明确的条件以保证这个算法可行. 

2. 证明， nsO ( S ' l AS )= a ( A ), 只要这个交取遍所有非奇异矩阵 S . 

3. 利用 （6. 1.5) 证明，对任意 A 6 R . 

| det A |< ] J ( X ； U , I ), 

I 

a 对列也有类似的不 等式. 提示： 如果 a 的任意一行是 零， 那就无需证明.如果 a 的所有行 
都非零，则设/3是这样的矩阵，它的各行是 A 的对应行除以该行的绝对行和，于是，根据 
(6. 1.5), ^oCBXl , 因而丨 det B 丨 <1. 注意，这说明 • 
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| det A | < JJ || cii || ,, 

1=1 

其中向 M 化是 A 的相应行（或 列）. 对其他范数，存在这样的不等式吗？ 提示： 见 （7.8.2). 

4. 在正文中，由 GerSgerin 定理 （6. 1. 1) 导出了定理 （6. 】. 】 Oa )- Levy - Desplanques 定理. 

证明，由 （6. 1. 10) 的 （ a > 部分可推出 （6. I . 1) 的前一部分[区域 （6. 1. 2) 包含 A 的所有特征值的 
论 断].提示： 把 （6. 1. 10 a > 应用于矩阵 A / —九 

5. 假定 A 6 M ~ 是实 矩阵， 且它的7!个 Gedgorm 圆盘都彼此分离.证明 A 的所有特征值 
都是实数.更一般地，如果复矩阵只有实主对角元，且它的特征多项式只有实系数， 

乂它的个 Gersgorin 圆盘都彼此分离，证明 A 的所有特征值都是实数. 

6. 证明，如果义=[心] eM ., 且对于 I •的々个不同的值有 | 〜 | >化， 贝忪 < ra nkA . 

7. 假定是幂零的 （ A 2 = A ) 但是 A 关/,证明 A 不可能是严格对角占优矩阵[或不可_ 
约对角占优 矩阵； 见（6.,2.25)和（6.2.27)]. 

8. 假定 A € M n 是严格对角占优矩阵，即 U 丨 > R ： 对所有:•=】，…，《成立.证明丨〜 | 

> C '* 对々 = 1,…， ” 的至少一个值 成立. 

9. 假定是严格对角占优矩阵，&设0=山叫(叫，七 2 ,…，《抑），证明 ， D 
是可逆矩阵，且 〆 / 一 D — A ><1. 提示： 利用推论 （6.1.5). 

10. 设 A =[ 且/?,二 〆 十丨〜丨表示 A 的第》•行所有元素的绝对值的和，证明 

rank A ^ ^ ^ • 

其中约定在这个和中 0/0 = 0. 提示： 用问一个非零纯《乘一行的所有元索不改变矩阵的秩， 

因而可以假定所有且所有尺或者是零或者是 1. 在这种悄形， A 的所有特征值都位于单 
位岡盘内且可以证明 


rank A ^ 

证明， 2^=tr A=2A.<S I A, I 的非零特征值的个数 <nmk A. 
11. 如果 A = = “ 2 …“ JEM, ，证明 


rank A ^ ^ 


U , I 2 

rar 


其中约定在这个和中 o / o = o . 提示： 如同习题 lo , 说明只需考虑下述情形就可以 r : a 的所 
有列有 E UC iid 单位长度，即所有丨义丨 2 =1; a 在这种情形可以证明 


rank A > 2 I … I 2 = S kI 2 ， 

••叫 t-l 

其中 Q ,，6 •…， e ” 丨是 C •的标准正 交基. 如果 A 有秩 々， 证明存在 A 个标准正交向镫 
%，•••，使得 Span < vi ，…， r *} = Span { a , * — , a „}. 于是 

* 会 

a. = ^(v ； a,)v l9 因而 i •: a, = 

> =1 i=i 
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且 




1 •’ <2 [(2 1 v > a > 1 2 ) (2 > e ' v > i 2 )]= 22 \ e > 0 v > i 2 = 2 1 

»-1 >^i >-i >=i »=i >=-i 

=k — rank A . 

进一步阅读用数值例子讨论 Gersgorin 定理可以在 [ Ste ] 中找到.原始资料可参呑 S . 
Gersgorin , 4t Uber die Abgrenzung der Eigenwerte einer Matrix , M / sv . Akad . Nuuk . S . S . 
. S . 亿 7(1931), 749-754. Gersgorin 定理有一个推广，它给出了关于广义特征值问题 = 
入仏•的谱的包含区域，其中包括 B 是奇异矩阵的情形：可参看 G . W . Stewart , "Gerschgorin 
Theory for the Generalized Eigenvalue Problem , Com put . 29(1975)，600,606. 关于 

本节 M 后一段提到 K 域 （6. 1. 12> 是否有更好的性质，可参看 R . Varga , "Minimal Gerschgorin 
Sets / Tdio / iVy . Math . 15(1965), 719-729. 

6. 2 Gersgorin 圆盘 - 更细致的讨论 

我们已经看到，严格对角占优性对于可逆性是充分的，但对角占优性则不是.某些 2 X 2 
的矩阵例子所需条件启发我们猜测 • 对角占优性连同严格不等式 

；I > 2 I ! 对/ = 1，…， w 中至少一•个值成立 （6. 2. 1> 


( 6 . 2 . 1 ) 


可能足可逆性的充分条件. 4\失屯的 正如例子 


|0 1 I (6.2.2) 

L0 1 1. 

所说明的那样，悄况并非 如此. 这里究竞会出现什么情形呢？ 

伸是，关于对 角占优矩阵，存 A —些辟通条件 • ft 这些条件下， （6. 2. 1>足以保证可逆性， 
外 a 它们在 ra 论中诱导出一些很有意义的 想法. 一个®要论断是，如果 a tt 对角占优矩阵， 
则 0 不可能是任何单个 Gersgorin 圆盘的内点. 

练习证明，如果一个给定点 A 不是 A 的任一 Gersgorin 岡盘的内点，当且仅当 


_ 

U - 尺：= 2丨 ^ I 


(6. 2. 2 a ) 


对所介/=1，…，” 成立. 证明 G (.4> 边界 t 的每一点 A 适合这些不 等式. 考察 a = 0 和 A 
A J ㊉ [: 一 U 来证明， G (.4) 的一个内点也可能满足不等式 （6.2.2 a >. 

仔细分析定理 (6. 1. 1) 的证明，当 A 的特征值满足不等式 (6.2. 2 a > 时会出现什么情形. 


6.2.3 引理设 A =[ 心] A 是 A 的位于 C ；( A ) 的边界上的特征值.设 Ar = A * r ，： = 

尹0，&假定/>是使丨心丨 = ma Xu -^ I | = || j U 0 的一个 下标. 那么， 

( a ) 如果々是使 | 心 | = | 心 | 的任一个下标，则 | A - ci ** | =/?；；即第々个 Gdgorin 岡 
经过 A ; 

(b) 如果对某个々 = 1，…•”，丨心丨=丨 j . p 丨，乂如果对某个 j 关 k , a kj ^0 , 则也有 
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丨 J，， I = 丨丨 • 

证明： 正如在 Gedgorin 定理的证明中所证明的，有 

(A — a u ) x , = 

>-» 

对所有1 = 1,…， ri 成立，因而 


I A — a* \\ x, I = j ^ I a 0 j j I = I “• ，丨丨 I 

1 /-I >»l 

>*• i 寒 i i 麥 i 

_ 

< Si 〜 \\ . r P \= R [ I •/ > |. (6. 2. 1 ) 

i-l 

W 此，如果々是使丨丨 == 丨 a > 丨的任一下标，一定有以一如 KR ；. 但是 • 假设条件是，对所有 
/=1，…，《冇丨4一“， IX . W 此，对 i = h 在 (6. 2. 4) 的不等式两边，实际上应取 等式； 即 

歸 n 

| A - d ** I I J -* I = J ] \ a k , 11^1= 2 \ a h I I j * I = K ； I I . ( t ) 

W 为 I * r * I = II J ： II .••>(), 所以论断 ( a ) SI 以从恒等 i . 

I A - I I x * I = I j -* I [354 

推出. 论断 （ b > 可从 （ t ) 中的屮间恒等式 

_ 

2 I I < I j -* i—I I ) = o 

推出， w 为在这个和中每一项必 k 非负的. □ 

这个引理肴起来® 偏赉于 技巧， 佰是它 有下述有用的结果及其推论作为直接推论 • 


6.2.5 定理设 AeM *， 乂设 A 是 A 的特征值， ftA 是 G ( A ) 的边界点，或更一般地， A 满足 
不等式 (6. 2. 2 a ), 假定 A 的所有元都是非零元.那么 
( a > A 的每个 GersRorin 圆经过 A ; 

( b > 50* Aj *== A . r , x = [ xj ^0, 则对所有 i , > = 1, — t ,,有 | 乃 | =丨 々 | • 

练习从引理 （6. 2. 3) 推导定理 （6. 2. 5>. 


6.2.6 推论设 A = 且假定 A 的所冇元都是非 芩元. 如果 A 是对角占优的•且对 

/=1，… • 《的至少一个值有丨丨 > i ?:， 则 A 是可逆矩阵. 

证明 •• 假如△不是可逆矩阵，则0就是 .4 的一个特征值.因为 A 是对角占优矩阵，所以 
0不可能是 G (4) 的内点，因而它一定是一个边 界点. 定理 （6.2.5) 说明，每个 Gedgorm 岡必 
定经过0,但是，如果 | 〜丨 > R ：, 则第/个圆不可能经过 0. □ 

前一个结果既实用，也有意义，不过，如果利用引理（6.2.3>中更细致的结果，还可以得 
到更好的结论（不涉及 A 中有关零元的假设条件）. 

6.2.7 定义我们称矩阵 A = [〜] eM H 具有性质 SX 、， 是指对适合的每对不同的 
幣数 P ， */，存在一系列互不相同的整数6=/)， t ， I ，…， h , k w = q , l « n ， 使得所 
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有矩阵元素\人都是非零元. 

例如，矩阵（6.2.2>不具有性质 SC ， 因为数对2, 1不容许有这样的非零元序列.但是数 
对〗，2的确有这样的序列. 

_ 利用这个槪念和引理（6.2.3>，可以得到关于 （6. 2. 5) 的下述改进. 

6.2.8 较好定理设 A = [“ y ]€ M „, 又假定 A 是 A 的特征值 ， ft A 还是 G ( A ) 的边界点，或更 
—般地， A 满足不等式 （6. 2. 2 a ). 如果 A 有性质 SC , 那么， 

( a ) 每个 Gersgorin 圆经过 A : 

( b > 如果 ArU ， 且 1=0.] 关0，则对所有/， ）= 1, 有 | 乃 | = |心 | • 

证明：设九 r = A _ r ， 且对所有》=1，…，/!有 | * r , | < | 心 | = || / || ..>0. 于是由引理 
(6.2.3 >， I | =/?；. 设 g 是任一其他下标， l « n , q ^ p . 因为 A 有性质 SC ， 所以 

存在一系列互不相同的下标 A , =/) •々: • … • k „= q ， 使得所有矩阵元素“ ，…，“、入 

都 非零. 因为尹0，根据 （6. 2. 3) 的论断 （ b ) 可知，丨 | =丨 a | • 但另一方面， 
因而 I % | = | % | = | a 丨 • 继续这样做下去，得知，对所有/=】，…， w 有 
1心.1 =丨心1，因而[由（6.2.3)( 8 >]有，|义一“^- I = I A —、 | =尺卜即第 y 个 
Gei ^ orin 岡经过 A ft U v | = | 心 | • 但因为 g 是任意下标，得知每个 G ㈣ gorin 圆经过 A 且 
所有 I I, I = I | , i=l, … ， w. Q 

如同（6.2.6>屮那样 • 从这个结果可以推导出一个关于可逆性的有用充分 条件. 

6.2.9 较好推论设.4 =[“"]云/^，且假定 A 有性质 SC . 如果 AJS 对角占优的，乂如果对/ 
=1，…， ”的至 少一个值有丨〜 | >/?:• 则 A 是 SI 逆 矩阵. 

练习由 （6.2.8) 推导 （6.2.9). 

练习证明矩阵 （6. 2. 2>不具有性质 SC . 

这个陌生的性质 SC 指的是什么？注意到，它只涉及 A 的非零非对角元的位 S ， 不涉及主对 
角元，且非主对角元的具体值是无关紧 要的. 由 f 这个缘故，我们定义与 A 有关的两个矩阵. 

6.2. 10定义如果 .A = [ a 0 ] eM „,. w , 令 | /\丨三[丨％丨 ] 和> = [〜•]，其中，如果“。关 

0, 则〜 =1，如果〜=0, 则〜 =0. 矩阵 M ( A ) 称为 A 的指标 矩阵. 

练习证明，矩阵 A 6 M ” 有性质 SC ， 当旦仅当丨 A 丨或者 M ( A > (因而两者都）有性 
_ 质 SC 

在叙述性质 SC 过程中出现了 A 的非零元序列槪念 • 它可以用与 A 相关联的一个图中的某 
些确定道路来形象地描述. 


6.2.11 定义的有向图，记作 r ( A >， 是关于”个结点&••••，匕的有向图，且 
有以 F 性质： 在厂 ( A > 中存在一条从 P •到 P , 的有向弧，当且仅当 a 关 0( 〜关 0 〉 

例 



^(A)= 
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6.2.12 定义图 r 中的有 向道路 y 是 r 中的一个弧序列 P .:', 有向道 

路 y 屮的 有序结点表是 尸， ， p , : ，…. 如果在有向道路中，依次出现的弧的数目是有限的，就 
称这个数为该有向道路 的长； 否则 • 就称有向道路有无限长.一个 回路是 起点和终点在同一个 
结点的有向道路；这个结点在该道路的有序结点表中恰好出现 两次， 且在该表中，没有其他结 
点出现两次以上^有些作者称这个回路为简 单有向回路. 长为1的回路称 为圈或 f •凡 回路. 

6.2.13 定义有向图 r 是强连遢的，是指在 r 中的每对不同结点尸， P , 之间都存在一条以尸 
为起点， R 为终点的有向道路，且有有限长. 

6.2.14 定理设 A 6 M . 耶么， A 有性质 SC :， 当 M 仅当有向图 r ( A ) 是强连通的. 

练习 iff 明定理 6.2. 14. 

练习证明如果 r 具有 性质： 每对结点 至少厲 十一个回路，则 r 是强连通的，但是，逆命 
题不成立. 提示： 



在有向图的两个结点之间，可能存在多条有向道路，但是具有不同长度的这样两条道路可 
能没有本质的差別；它们可能包含一条或多条®复出现的子道路.显然，如果我们沿着一条有 
向道路前进时，曾两次遇到某个结点 • 那么去掉第一次遇到该结点到第二次遇到该结点间的所 
有中间弧（去掉的子图是一条回路或包含一条回 路）， 这条有向道路便可以缩短（且两个端点不 
受影 响〉. 

6.2.1 S 论断设 r 是”个结点上的有 向图. 如果在两个给定的结点之间存在 r 中的一条有向 
道路，则在这两个结点之间存在一条长不超过71 — 1的有向道路. 

我们应该怎样说明给定的矩阵 A 是否具有性质 SC 呢？这等价于验证厂 ( A > 是否是强连通 
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的.如果《不很大，或者如果 MC4) 有一个特殊的结构，那么可以只检査厂 (A) 并划出所有可 
能的结点对之间的道路.但是，这在一般情形下是不实用的，因此需有某个明确的计算方法. 

镛 

6.2.16 定理设是给定的矩阵，乂设 R 和 R 是 r ( A > 的给定结点.那么，在尸和尺 
之间存在 rM ) 中的一条长为// I的有向道路，当旦仅当 （ 丨 a r>, y ^o ， 或等价地，如果 
3581 [M(A)UO. 

证明： 我们用归纳法 证明. 对//2 = 1 ,结论是明 S 的. 对 w = 算出 

[ma = Ecm ILH.4 a , =公 I 〜 11% I, 

因 Ifu ，[ I a | 2 ],^ 0 , 当且仅当对々的至少一个值，〜和都是非零的.但是，这种情况成 
立，当且仅当在 r(A> 中存在一条从 P 到/>,的 道路. 一般地，假定对 m = ( /结 论已经证明. 
于是 

[un = i ： n.4 卜 mmu = Ecur]* i^o 

*-I 

当且仅当对々的至少一个值 ， [I A 卜 ] rf 和丨〜，丨都是非零的.这等价于有一条从只到的 
长为^的道路及一条从 h 到匕的长为1的迫路，而这种情况成当 a 仅当存在一条从尸到 
G 的长为 (/ + 1 的 道路. 同样的证明对 M ( A ) 也是 SJ 行的. □ 

6.2.17 定义设= 我们说 A > 0 ( A 是非负矩阵 >,是指它的元索〜都是非负实 

数. 我们说 A>0(A 是正矩 阵〉， 是指它的元索、都是正实数 • 

6.2.18 推论设 A€AC 那么， IA 卜〉()•当且仅当从 r(A> 中的每个结点 P , 到每个结点 
p i ， 在厂(焱>中都存在一条长恰好为 w 的有向道路.相同的结论对 M(AT 也成立. 

6.2.19 推论设 A6AC 那么， A 有性质汾二当 11仅当 （ /+丨 A | )•_ 1 >0 ,或等价地，如果 

[/ + M(A)]"-*>0. 

证明： “+ I A I )” 'W + U—l) | A I + (” 2 ” I A | 2 +… + (” ;) I A l"- 1 〉。， 当 

且仅玛对诸结点的每对（/, _；•>, i 竽 j , 在诸项 | /\丨 • | /\ | 2 , | A 中，至少有一个正 

(*， ）） 元. 何是 • 定理 （6.2.16) 说明 • 这种情况成立，当 a 仅当 A r(A ) 中存在从尸到 P , 的某 
条有向 道路. 它等价于 r(A> 是强连通的，而这乂等价于 A 具冇性质 SC. □ 

练习证明推论 （ 6. 2. 19>中涉及 M(A) 的 论断. 

_ 6.2.20 推论在 r ( A ) 中存在从尸到 P , 的道路.当且仅当 [(/+ 丨“丨 

练习试用推论 （ 6. 2. 19) 给出关于性质 SC、 的一个明确的计算检验法，它只需要对矩阵自 
乘大约 log_，（M_l) 次，而不是 ”一2次. 提示： 考虑（/+丨4丨） 2 ,这是平方，然后依此类推. 

在结束这个论题以前，我们要引进性质 s (:的另外一个等价的描述 • 它基于 r</\) 的强连 
通性只是 r(A) 的拓扑性质这一車实——它与 r(A> 的诸结点所规定的下标毫无 关系. 如果改变 
诸结点的下标顺序，图仍然保持其强连通性或非强连通性.要注意的是，如果交换 A 的第 i 行 
和第）行以及第/列和第）列，这对 r ( A ) 的影响是交换结点尸和 c 的下标，反过来也 



特征值的估计和扰动 


257 


-样. 

我们知道，转 置矩阵 P 是方阵，它的所有元素为 0 或 1; 在 A 的每一行和每一列恰好有一 
个 1. 显然，这样的矩阵是酉矩阵，因而是正交矩阵，所以 = 最简单的置换矩阵 P 对 

/， ） 的每个固定选择有 p y =/>,, = l ， 且所有其他非对角元为 0. 于是，相似 P T AP 对 A 的作用 
是交换 A 的第;列和第）列以及交换 A 的第/ 行和第）行 . A 的行和列的任一置换可以依次用 
这种形式的交换来得到.并 E 任一曹换矩阵是这样一些简单置换矩阵的有限乘枳.因此，如果 
尸 是置换矩阵，则通过适当置换 A 的若干行和列可由 A 得到相似尸 M 尸.里要的是要知道， 
是否可以求得 A 的行和列的某个置换把 A 变成下述特殊的分块形式. 


6. 2.21 定义矩阵 A 称为可约的，指的是 
( a )， i=l a A = 0; 或者 


( b ) w >2, 存在置换矩阵 PeM ，， 且存在适合 l < r < n — l 的某个整数 r , 使得 


P T AP = 


-/3 
• 0 



其中， BeM , DeM … C € M r .•，，，且 oeMe , 是零 矩阵. 

注意，我们并没要求子块 B , C 和 D 有非零元，而只要求通过一系列行的交换和列的交换 
可以在指定的位酋上得到一个由0元组成的 （w — r>Xr 块. 如果 I A I >0,显然 A 不是可约 
的，乂如果 A 是可约，则它至少必须有 U — 1>个0元. 

附注假如想解线性方租组 Ajsjy , 且假定 A 是可 约的. 于是，如果记 A = P t AP == 

[ H (2 1 

，則有或2(/>〜）=尸、令 :• (未知） 


和 p \ v =^=0 7 ; o /] 7 (已知），其中 • u > ec . 而 o>ee r . 因此，要解的方 

»组等价于 a ; +[:(」[:]=[:].印等价于 

Bz Cf =us 
Of = w . 

如果首先对 c 来解 Df = c ^ 然后在第一个方程中采用 C 并且对 z 来解 Sz = u ；_ Cf , 那 
么就把原来的问題化简成两个较小的问題 • 一般 说来， 它们应该是比较容易解 决的. 

这番评注就是促成定义术语可约矩阵的理由. 

6.2.22 定义如果矩阵 A € M „ 不是可约的，就称 A 是不可约的. 

6.2.23 定理矩阵 A 6 M , 是不可约的，当且仅当 

(/-H A \y 1 >0, 

或等价地，如果 [ Z + iWAfX ). 

证明：我们实际上要证明， A 是可约的，当且仅当 （/+ | A | >" _| 至少有一个零元.首先 
假定 A 是可约的，且对某个置换矩阵 P 有 


13601 


A = P 


~B 

.0 


c - 

DJ 


P T = PAP 



其中 C , 0 和 D 是定义 （6.2.21) 中的分块矩阵，注意到 P 的作用仅仅是交换行和列的顺 
序，所以 I A | = | 以尸 r | =P | A | P T ; 同时还注意到， | A | 2 , | A | 3 , …，和 
A —样，在其左下角都有相同的 U — r)Xr 0 子块. 因此 

(/+| A |>『 l =(/ + P | A I P T ) rX = ( P [/+| A |] P r )H = P (7 + | A |)"- l P r 

=P J + | 2 + … + (:=;)| A | 『 i]P r , 

R h 述方括号中的所有项在其左下角都有 U — r*)Xr 0 子块.于是， （ /+丨 A |广― 1 是可约的， 
_ 因而它的所有元不可能都是非零的. 

反之，假定对某个/>关《?, (/+ 丨 A 丨广― 1 的 （/>, g ) 元是 0. 于是得知在 r ( A ) 中不#在从 
到/%的有向道路.定义结点集 

S , = { P ,： P , = P q 或在 r ( A ) 中有一条从只到仄的 道路} 

乂设 s 2 包含 r ( A > 的所有不在 s , 中的 结点. 因…，/\>且所以 
s 2 ^< p ,, pj . 如果从各的某结点只到 s , 的某结点 c 有一条道路，则（根据 s , 的定义）存 
在从 P 到 P v 的道路，因而 R 已在 S , 中. 因此，从 S 2 的任一结点到 S , 的任一结点不可能有任 
何 道路. 现在我们重新标记结点，使& = {戶,， …， 和&=彳戶,，，，•••， PJ , 注意到 

厂 B Cl 

A = p m p == l 。 pj ， Be M t9 oeM " 〆 ， 

因此 A 是? il 约的. 关于 [/ + M ( A )： r i > 0 的证明不过是作同样的论述. □ 

我们作一下总结. 

6.2.24 定理设则下列命题 等价： 

( a ) A 是不可约 矩阵； 

( b ) (/+ I .4 丨广 *>0； 

( c ) [/ + M ( A )]-* , > 0 ? 

( cl ) r ( A ) 是强连 通的； 

< e ) A 具有性质 SC . 

6. 2. 25 定义设 A 6 M ”. 称 A 是不可约对角占优矩阵，是指 A 适合以下 条件： 

( a ) A 是不可 约的； 

< b ) A 是对角占优的，即对所有,=1,…， ”有| 〜丨 ^ R ：( A )； 

( c > 对/的至少一个值，有丨〜丨 > R ：( A ). 

练习用例子说明，一个矩阵坷能是不司■约的和对角占优的，但不是不可约对角占优的. 
1362] 采用现在的术语， 可以® 新表述“较好定理 ”(6.2. 8>及其推论 如下： 

6. 2. 26定理设 A €: M ” 是不可约的.则仅当每个 Gersgorin 圆经过 A 时， Gedgorin 区域 
G ( A > 的边界点 A 才玎以为 A 的特征值. 

6.2.27 推论 （ Taussky ) 设 A = O v ]€ 是不可约对角占优矩阵.那么， 

( a ) A 是可逆 矩阵： 
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( b ) 如果 所有〜 >0,则对 A 的所有特征值夂有 R e U ,)>0 ; 

( c ) 如果 A 是 Hermite 矩阵（或更一般地 • A 只有实特征值），又如果 A 的所有主对角元都 
是正的，则 A 的所有特征值都是正的. 

6 . 2.28 推论设是不可约矩阵，旦假定对 i 的至少一个值有 

R. = ^ \ ^ | < If A |U ， 

即不是所有绝对行和等于极大绝对行和.则 〆 A ><;| A || L . 更一般地，如果/>,，…， p n >0, 

如果 

D = diag ( pi ， p z ， … ./>,). 

又如果对 f 的至少一个值有 /?,(D -' AD )<!!! D-MDL ,则 p ( A)<l D ' l AD \\ l . 

证明： 我们总有界 〆 而等式成立，当&仅当存在 A 的某个特征值 A 适合丨 A I 
=||| A |... 另一方面，根据定理（6.2.26)，每个 Gei ^ gorin 阅必定经过 A . 但是，某个尺，<|||/\亂， 

的假设条件与这相矛盾.把同样的证明应用于便得出第二个论断. □ 

习题 

1. 证明不可约矩阵不可能有0行和0列. 

2. 用例子说明推论 （6. 2. 28>中的不可约性假设是必不可少的. 

3. 假定 A = [〜] eM n ， A 是 M | =[ 丨〜 | ] 的特征值,.且存在所有 * r ,〉0 的向试 i = 

[ x,]e R M 使得 I A I 1 = ". 设 D = diag (* r , • A , …， ). 证明 D 1 | A | D 的每个 [363 
Gedgorm 圆经过 A , 画出它的 图形. 关于 D 的绝对行和，你能说些什么？ 

4. 在第8章中将证明，具有正元素的方阵总有正特征值和相应的正特征向 M . 利用这一 
书实和上一个习题证明，只要 A 的所有元是非零的，就有 

p(A)^p( \ A |). 

试用连续性证明， A 的所有元是非眾的条件可以略去，因而对所有有 

p (, A )^ p ( \ A |). 

5. 试用推论 （6. 2. 28) 证明，关于多项式 

p ( z ) = 2 " 4 a n .\ z m 1 4-…+^2： + ci 。 ， a 0 矣0 
的根的 Cauchy 界 （5. 6. 40) 在不出现下述情形 

I a 0 | = | c/j 丨 + 1 = I ci 2 |+ 1 =…=1 dd |+ 1 

的假设下可稍许改进为 

丨 2 ： |< max { I a u | ，丨〜|+ 1， | ci z |十 1，…，丨 |+ 1 }. 

提示：证明，若如关0，则 （5. 6.39) 中的友矩阵 C (/»> 是不可约的， SM 0 n telW (5.6.41)， 
Carmirhael 和 Mason 界 （5. 6. 42), Montel 界 （5. 6. 43)，以及 Kojima 界 （5. 6. 45>可作何改进？ 

进一步阅读关于 Levy - Desplanques 定理的讨论以及许多有关的参考文献可参看 O . 
Taussky , “A Recurring Theorem on Determinants, M Amer . Math . Monthly 56 ( 1949 )， 
672-676. 
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6.3 扰动定理 


设 DsdiagU ,, A 2 ，…， A „) eM „, 设并且考虑被扰动矩阵 D + E . 根据 
定理 （6. 1.1>， D + E 的特征值在诸圆盘 

颺 

j s 6 C ： | z — X ,- e ^ j < R [( E ) = 2 * I } * 1 = !，…， w 

广 I 

Ml 中，它们乂包含在诸岡盘 

鳟 

{z C ： \ z — X , R ,( E ) = ^2 \ e „ I } , ，. = 1，…，” 

/叫 

中，因此，如果 A 是 /) + £ 的特征值.则存在 D 的某个特征值 A ., 使得丨丨 <|| E || U 遗 
憾的是，这个简单的佔计不能推广到一般（非 对角〉 的悄形，但是，在矩阵是可对角化的悄形， 
可以给出一个简单的界. 


6. 3.1 论断设是可对角化矩阵，且 A = diag ( A ,, …，夂>.设 
如果 A MA + £： 的一个特征值，则存 ft A 的某个特征值夂， 使得 

IA - ld|4s 丨 ! IU =ic..(S)i||f；||. 

K 中 /r (•) 表示关 f 矩阵范数 || • t 的条件数. 

证明： 因为 A + E 和 S _(A + E>S = A + 5 T I 厂 S 有相同的特征值，乂 W 为 A 是对角矩阵, 
所以，前述论证说明，存泎 某个 A ,， 使得 U — A . I W 为 ll . l .是矩阵范数 ， W 

此所述不等式成立. □ 

在技巧 f ffl 作修改，便可把这个结果推广到不同于极大行和范数的其他矩阵范数.矩阵范 
数的关键假设都被单调或绝对向 M 范数诱导的所有诱导矩阵范数满足；见 （5. 6. 37). 


闕 


6.3.2 定理设■是可对角化矩阵 • 且 A = A = di a g ( A, ，…， A ”）. 设 

乂设 IH 是这样的矩阵范数 • 使得 || D | 卜 max •认 ■ 14 | 对所有对角矩阵 D = diagU |, …， <) 
成立. 如果 i 是 A + E 的一个特征值，则存在 A 的某个特征值 A ,, 使得 

I A-A, l< |St!|S 1 | \\EI^k(S) (E|||, (6.3.3) 

其中 <(• >是关于矩阵范数 it • |1 的条件数. 

证明： 如 H 上一个结果那样，只要考虑 S , < A - hE)S = y \ + S 的特征值就可以了.如 
果乂是 A+S 的特 征值， 则 A / — yl — S 是奇异 矩阵. 如果 i /— yi 是奇异矩阵，则对每个, • 

有 A = l ， 因而界 (6.3. 3>显然被满足.但是，假定 A /— A 是非:奇异 矩阵. 在这种情形，矩阵 

(XI -A) l (Xl -A-S l ES) = I-UI -Ar l S 1 ES 
是奇异矩阵，因而，根据 （5.6. 16>，一定有!于是， 因为 假定矩阵范数 
|卜 II 关于对角矩阵所具有的性质，有 

1 <!||(A/-A)-'S 'ES i < liS 'ES|| |f(A/-A) ' | 


= ! i s 1 ES imax I A — A , 

l«lt 


IP S l ES I 
min I A — A , 
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W 此 

min I A - A . |< |： S 1 ES f | S 1 f IS|f ㈣ =/ c ( S )| E : |L □ 

练习证明，定理 （ G .3.2> 假定矩阵范数在对角矩阵上所具有的性质，下列各个范数都满 
足：|.| 2 , Ihl. ，I - II .- 至少给出另一个矩阵范数 • 它也满足上述假设. 

练习给出一个矩阵范数，它不满足定理 （6.3. 2>的假设. 

练习证明|卩| = 1对任何丙矩阵成立. 

虽然在 （5.8) 中曾出现过条件数<(•)，它是由于线性方程组解的误差界引起的，但是我们 
看到，现在在 （6. 3.3> 中也出现了条件数，不过它是在计算可对角化矩阵的特征值中作为误 
差比 

丨乂 一又 I 丨 ✓ C *、 

- JW <K 

的上界而出 现的. 如果 Af ( S > 较小（接近1>,则小的数据扰动可以使特征值产生扰动，不过特征 
值的变化范 W 以数据变化的相同数蛍级为界. m 是，如果 as ) 很大，则小的数据扰动可能引 
起特征值的比较大的变化. 

与 （5.8) 中关 f •线性方程绀解的悄况不 M 的 S . 这里 WA ) 没有多大意义，但是 / C ( S > 是 
很® 要的， K 中 ， A = 而 . SM 以 A 的特力列的 矩阵. 关于诮范数的条件数具存 

ic ( S ) = cot (0/2) 的几何解释，其中沒是当和: y 取遍所有可能的非芩正交向量时与 S . v 之间 
的 W 小夹角[见例（7.4.26>]. W 此•它不依赖 A 的条件数.如果 A 的一对线件无关的特征向 
W 接近 fH ， 那么 S 的两列 （ 例如 • 第 p 列和第 c /列. />关(/>可能接近平彳7 ， W \(\ i . 即使申-位基 
向和。是正交的，义，与 S > v 的夹角仍可能 很小. 在这种悄形， if ? 条件数将很大， 
IW 确定 A 的特征值问题就可能是病态的. 

但是 • 如果 S 是西（或抟近 于两）矩阵. 则 . S 将 把-对 正交向楗变成正交（成将近于 正交） 向 
W ， 并 iL . S 的谘条 件数将会很小（实际上，如果 . s 是两矩阵，它等于 1). 在这种情形，确定 A 
的特征值的问题一定足 a 态的.今然， 一个矩 阵 （ 恰好>可以两对角化，当11仅当它是正规矩 
阵 • 所以， （6. 3.2> 给出丫关于整个正规矩阵 （特別 是 Hermite 矩阵和实对称 矩阵〉 类的扰动定 
理，它与原来的关于对角矩阵的论断 H 有 N 样简单的 形式. 正规矩阵关于特征值的汁箅是优 
态的. 

6.3.4 推论设足具有特征值 A ,• A •的正 规矩阵 • 乂设如果 A 是 A +£ 
的特征值，则存在 A 的某个特征值 A ., 使得丨 A - A , I <| E |. 

注意，扰动矩阵 E 和被扰动矩阵 /\ + E 都不一定是正规 矩阵. 推论（6.3.4> 常常应用于实 
对称矩阵 A 的情形. 

练习给出推论 （ 6 • 3 • 4 ) 的洋细证明. 

练习如果知 ifl A 和£都是 Hermite 矩阵.则可以利用 Weyl 定理 （4. 3. 1) 给出比 （6. 3. 4> 
中的界吏好的界_如果 A , / TeiW ” 是 Hermite 矩阵， 乂如果 A , 是 A 的有序特征 

值， A ,< A 2 < …是/\十£’的有序特征值 • 是 E 的有序特征值，试用不 
等式 （4.3.2) 证明，对所有々；丨，2,…，，/， 
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且 

\X t -X t \<p(E) = 11 ^ 4 . 

说明为什么这个界比 （6.3.4) 好.如果已知 E 的所有特征值是非负的，这提供了什么信息？ 
在数值应用中 • 原矩阵 A 和扰动矩阵£：都是实对称的情形并不少见.在这种情形以及在 
A 和/ \+ E 都是正规矩阵的更一般的情形，关于扰动，存在一个对所有特征值都适用的涉及全 
局的界. 


6. 3.5 定理 （ Hoffman 和 Wielandt ) 设 A , E 6 M ., 假定 A 和 A +£:都是正规矩阵，设 
…，是按某个顺序给定的 A 的特征值，彳 A ,,”*, 是按某个顺序给定的 A + E 的特征值. 
则存在整数1，2,…， n 的一个排列 a (/) 使得 

[E I A ^.- A . | J ] ，/2 < l | E || 2 . (6. 3.6) 

证明： SA = diagU " A ,), A = diag ( A ,, AJ , 设 M , 是使 A = VA V . 的两矩 

阵，而是使 A +£= WAW •的酉矩阵.于是，因为 Fmbemus 范数是两不变的，有 

II E || i = || (A + E )- A ||| 

=|| WAW - V ，||! 

=II vwAwv - aII ! 

= llzAz- - Alii 

= ir(ZAZ' -A){ZAZ 9 一 W 
=tr(AA • + W )-xr(ZAZ' A- AZA - Z 9 ) 

螬 

= f ( U , | 2 +u | ? )-2 Re xt(ZAZ-A- ), 

其中已令这个表示式说明 

M 

II 丨乂 • l 2 +U l 2 >-2 max < R e t r ( UA [； m ； 是西矩 阵}， (6. 3.7) 

• »l 

我们要证明，这个下界的精确值就是所确定的界 （6.3.6). 如果则容易算出 

Re tr(UAU'A') 二 J |〜 |， Re ( U ,>， 

*•>* * 

而我们感兴趣的是，当 U 取遍所有西矩阵组成的紧集时 • 这个表示式的极 大值. 如果令 
c ,> E | 〜丨 2 ,且设 c =0 y ]， 则矩阵 C 6 M •就是具有非负元的矩阵，且它的所有行和与所有 
_ 列和恰好都是+ 1(因为 L / U .= Lrt ；= D . 因而， 只要 [/是 H 矩阵， C 就是双随机矩阵，乂如 
果修改我们的极值问题，允许取所有双随机矩阵，则我们将在一个知道其结构的紧凸集上更有 
利地考虑这个极值问题，在这个较大的区域上的极大值当然可能更大 一些： 

max{Re trOJAU' A' ) ：U 是酉矩 阵} = max { | u 0 fReUA^zU 是两矩 阵} 

舞 

< max { 乏>„ Re ( U ) : C 是双随机矩阵 } 
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但是，这个求极大值的函数是紧凸集上的线性函数，所以在该凸集的一个端点上取得极大值 
(见附录 B 并且注意到线性函数是凸函数）.根据8^^ 0 £【定理（8.7.1)，双随机矩阵集合的各 
端点都是置换矩阵，因而存在置换矩阵 P 6 M W ， 使得 

it 

max { 2 c * y Re ( X . 夂 ）， C 是双随机矩阵 Rc \ r { PAP J A 9 ). 

“， -i 

因为置换矩阵是酉矩阵，所以也有 

max<Re xt ( UAU ' ) ：U 是两矩阵} = Re tr ( PAP T A a ). 

如果对 f = l , 2，…， n 有 Pq = 〜、， 则 

n 

Rc tr ( PAP t A * ) = ^ RcCX ^ X .), 

而 （6. 3.7 H 兑明 

II E ll !> l 2 +U l :-2 RH >] 

1-1 

IV 

= I A «<,» 一 A , 1 2 . □ 

»-1 

定理 （6.3.5) 说明，对正规矩阵的特征值集合，存在很强的全 W 稳定性，但是它没有说明 
究竞是特征值的哪个排列将满足所述不等式.并不是特征值的每个排列都满足这个不等式，实 
际上，至少存在特征值的一个排列，可使（6.3.6> 的不等式反向（见本节米习题 7). 然而，在 
HermUe 矩阵 这一承 要特殊情形，特征值的 A 然顺序能满足 （6. 3. 6〉中的不等式. 

6. 3.8 推论 设 A , E6K, 假定 A 是 Hermite 矩阵 • A + E 是正规矩阵，设 { A ,， …， A , } 是 
A 的特征值，且排成递增觖序…<夂），乂设 U ,, …是 A + E 的特征值，使其有 
顺序 ReA ,< ReA 2 <-<Re 夂•则 

[t IA .- A , i 2 ] ,/2 < IIEIU . 

#• I 

证明： 根据定理 （6.3.5), 存在 A + £ 的特征值的给定顒序（递增实部）的某个排列〜使得 

IV 

[2 H — A , I 2 ]〗： d ^11?. (6.3.9) 

9^ I 

如果 A + E 的特征值 在表八 ”，…， A ^、 中已使它们的实部成递增顺序，那就没冇什么可证的 
了.否则，在上述表中有两个相邻的特征值，其实部不按递增顺序排列，例如，对某个适合1 
的々， 

Re Re > . 

但是，因为 

I ^«<*> 一又 * 卜 + 丨 — A*h 1 2 = I _ A * ! 2 ~H A ^*) — A*h 1 2 

+ 2 U * — A^i )(Re — Re ), 

乂因为根据假定， A t - A * + I <0, 所以得知 

I — A * h + 丨 n — A**-i 1 2 ^I ~~ A * ! 2 - i - 1 X ol ki 一 A*+i I 2 . 

因此，可以交换两个特征值和乜* +1> 且不增加平方差之和.通过有限次这样的交换，特征 
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值表 Lu ， …，珂以变换成表 A ,, i 2 , …， h ， 使其实部是递增的，&所确定的界成立 • 

□ 

实际上，这个推论经常位用于 A 和 A + E 都是 Hermite 矩阵或者甚至于是实对称矩阵的情 
形. 

练习证明，如果 A . 是 Hermite 矩阵又如果它们的特征值都按递增顺序或都按 

递减顺序排列，则 

(StA.(A)-A,(B)?) ，，2 < \\A-Bh. 

卜雇 

练习说明，如果 A 和衫=/\ + £不都是正规矩阵，则定理 （6.3.5) 中的结论不一定成立. 

_ 提示： 设 B = r C \ H 然后说明.对特征值的任一_， 

2 

2[ A .( A ) aAB ) J £ = 16. 

• ^ 1 

如果 A 不可对角化，就不知道有像定理 （6. 3. 2) 中那样简单 的界. 但是有可能导出一个简 
明的公式，它说明，当矩阵的元索产生扰动时 • 矩阵的代教单重 特征值 （代数歌数等于 1) 如何 
变化. 苜先给出一个引理，说明相应于一个单®特征值的左特征向 M 与右特征向《具冇非正 
交件. 

6.3.10 引理如果 A 6 R ， HA 足 A 的代数单5:特征值，乂如果 j •和. V 分别是相应于 A 的特 
征 flU 的右特征向 M 和左特征向 tt ,则 y - r ^ O . 

证明： 如果 A * r = A * r , * r 关 ()• 则可以采用在 Srhur 三角化定理 （2. 3. 】>的证明中所使用过的 
方法，构造其第1列是 W || ilk 的 H 矩阵 L ；, 使得 

因为 A 是/\的单重特征值 • 所以它不可能是《的特征值.单位基向 w A 是 IT 的 W 十 A 的 
特征向 M . 现在考虑 

(U'AU)- = "• A.U =[:4 fi 0 : ]• 

a 假定 cr / vuFAz ， 其中如果 ，=[ o : rl , 则洋 o 是 / r 的属于 a 的特征向 《：. 
另一方面， A 就应是 H 的特征值，这与假设相矛 ffi. 由此得知，2不能以零作为第一个分量， 
即笋 0. 但是关0, a 向址仏和仏，是 A 的厲于 A 的左特征向 M 和右 
特征向 M. 因为根据假定， A 的关于 A 的左特征空间和右特征空间都是-维的，所以对某个 a 
关0，一定有但是 || j * || 2 L ^ ,因此: y* 关0 — 定 成立. □ 

练习考虑/^ |].说明，如果从假设条件中略去“代数单重”，则引理不 成立. 

现在假定 A 是 A 的代数 单重特 征值.于是 A 有唯一（除了差一个纯 M 因子 fl 以外， | fl | 
HH =1) 确定的正规化右 A 特征向 Mj * 和唯一确定的左 a 特征向 M ： v , 它可以通过关系 3-* X =1 (E 
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规化.如果考虑可微的参数族 AG )， 使得 A (0)= A [例如 • Mt)=A + tE , E 为固定的扰动矩 
阵],则对所有充分小的/，存在 A ( r ) 的唯一确定的单重特征值 AG ), 使得 A (0>== A . 同时存在 
一个右 AU ) 的特征向它由条件 = l 唯一确定（如前，差一个因子还存在一 
个左 A (/) 特征向错 y ( t ), 它由条件^*(/)^(/) = 1唯一确定. 

如果微分这后一个正规化条件，则得到恒等式 

y • (/) x (/) + . V * (/>•!■’(/) = o . (6. 3. 11) 

因为对所有小的/成立，所以也有恒等式 y -( t ) Mt ) x ( t )= X ( t ) y ， ( t ) j：(n 
= A (/). 如果微分这个恒等式，便得出 

A’(/)= ： y 〜 O)A(t)xU) +y 9 U)A\t)x(t)^y a (t)A(t)x(t). 

但是，因为 AU )_ t (/)= K /) j *(/) 和 . vDA (/>= A (/> y ( r ), 这就变成 

X\t) = (/>*r(/> +， -by' (/M'(/>_r(/> = ， •⑴. 

我们已经用到了恒等式 （6.3. 11>. 在/= 0,这在正规化条件， i = l 和 y 1=1下，正好是恒 
等式 A '(0)= y 如果 . i •和 . v 是右 A 特征向 M 和左 A 特征向《,它们不一定用上述方式 
正规化，可以用 1 /(， o *) 1 ' 2 代转 I ,用代替 ：y 来得到一般的恒等式 A'(0> ： y\r = 
V - A ^ O )^. 至此已经证明丫关十矩阵 A 的下述结果，它不要求 A —定可对角化. 


6.3.12 定理设在/=0可微.假定 A 是 A (0> 的代数单嚴特征值 • 并且假定对小的 
/• AG ) 是 / Un 的特征值.且使 A (0>= A . 设 j •是 A 的右 A 特征向 ： y 是 A 的左 A 特征向 
址，则 

A ' (0> = ^0),. 

•Vi . 

练习设 A (/) = A + 4'， 其中 E 是固定的扰动矩阵，（在定理 （6.3.12) 的假定下）证明， 
在 / = 0 * 

cU _ 〆 Ej 

_ ■_ ■ ■ 

d / 

练习在定理 （6.3. 12) 假定下， 证明， 对任意 I ，）， 

JL = 

而 .， y m ^ 

这个公式说明，相对于 A 的任一元素的变化， A 如何 变化.提示： 设 E = E ,,， 它是矩阵， 
且其仅有的非零元在/， j 位置上. 

练习考察矩阵焱=[^ J 如果 e ^0, 特征值 A =1 就是单 电的. 对所有四对, •， j , 

直接算出当 e — 0时，这些变化具有什么性质？由此可知，如果 a •和 y 接近正交，那 
么，对于 A 的某些扰动，特征值 A 可能是很灵敏的. 

与特征值的情形形成对比，仅仅因为矩阵元素的小扰动，即使是对角矩阵的特征向量，也 


可能会有很大的变化.例如，如果 A = 1 °1, ftE - T 6 ^1,其中 € , ^#0,则 A + E 的特 

-0 1」 L 0 0」 


征值是 A = 1 和1+ € ,而相应的正规化特征向 M 是 


0 


对于任意小的 e 和 ^ 通过适当选择 e 与8之比，可以把第一个特征向量选定为任意方向上的 
点已解. 

如果令 e = 0, 则对任意被扰动矩阵 A + 只有一个无关的特征向讀，而 A 

却有两个无关的特征向量. 

迄今我们的所有估计是艾于矩阵的扰动所引起的特征值误差的先验界；它们不涉及所计算 
的特征值或特征向或由它们导出的任何 tt . 假定“近似特征向贵” i •关0和“近似特征值” A 已 
经用某种方式求出宋 * 可能不是 Ai 恰好等于 A i 的情形，但是，当 A 可对角化时 • 可以利用 
剎余向 $ r = Ai — Ai 得到一个估计，确定 A 是如何接近 A 的一个特征值. 

EA = SAS ' 且假定 i 不恰 W 等于 A 的任何特征值.于是 

r = A x — X x = S(A —XI )S 1 
所以 .f = k S ( y \— A /> ' S _ l r . «此. 

Ilill = \\S(A-Xl)- l S l r\\ ^iS(A-xir l s- l \l llrll 

^ISyS^lM-A/) «||： II HI =KiS)\\{A-Xl) 'I llrll 

=/f(S)| min I A, — A I J II r II ， 

从而 

II J. I; min I A, ~ A | < k(S) || r || . 

显然， 即使当某个 1=^时， 后一个不等式仍然成立.对于上述论证 • 已经假定 

( a ) INI 是 CT 上的向 M 范数； 

( b ) 上的矩阵范数 H 1 I 与 IMI 相容： (6. 3.13) 

( c ) | D HI = max I £/, | • 如果 D = diag ( c /| ，…， J n )^： M h ； 

lv ,»« n 

fl 条件数 AC ( S ) 是用矩阵范数 [!• I 来计 算的. 如果 A 是正规矩阵 • 则 S 可以取为两矩阵，乂如 
果采用/:向址范数和进矩阵 范数. 则有= 条件 （ C ) 等价十要求矩阵范数 If 叫||是山单调向 
W 范数 i 秀导的[定理（5.6.37>]. ㈥ 此，如果 Ml fee •上的单调向 M 范数，且 HI 是由 | 卜 || 诱 
导的上矩阵范数，则 （6.3. 13) 的所冇条件都被 满足. 这样，就证明了关于后验界的结果， 
它与定理 （6. 3. 2>和推论 （6. 3. 4) 具有相同的形式. 

6.3.14 定理设是可对角化矩阵，辽 A = SAS *和 A = diag ( A " …， A „>. 设 CT 上的 
向 M 范数 IH 和上的矩阵范数 | •〖适合条件 (6. 3. 13). 设 ieC ” 是给定的非零向敏 ， A 是给 
定的复数，且广=八.?•一则存在 A 的某个特征值 A ,， 使得 

U ^ A . KlsyiS -!|| JLd ^ - ,( S ) JWL . (6.3.15) 

如果 A 是正规 矩阵. 则存 ft A 的某个特征值 A ,, 使得 
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这后一.个结果可能不同于线性方程组的解的相对误差的后验界的相应 结果. 如果线性方程 
组的系数矩阵是病态的， （5.8. 11>说明，小的剩余向 M 并不蕴涵解的小的相对误差.然而， 
(6.3. 16) 却说明，如果 A 是正规矩阵（实际上， A 通常是 Hermite 矩阵或实对称矩阵），又如 
果近似特征向董——特征值偶有小的剩余向 tf ：， 则可以保证特征值的绝对误差是小的；没有条 
件数出现在界中. 

这个关于特征值的惬意结果没有关于特征向 ft 的类似的惬意结果相匹配.即使对于实对称 
矩阵，一个小的剩余向 M 并不保证近似特征向莆接近于一个特征向 M . 例如，考虑 
_ 1 * 

'.€>0. 如果取乂 = 1和士=[1, 0] T , 则剩余 向世是 r =[0, e ] T . 对所有 e >0, /\的 
Le 1 J 

特征向 M 是 [1， 1] 7 和[1, —1] T , 而不论 e 如何小， i 不近似平行于这两个向卅中的任何 
-个. 

练习证明上述例子中 A 的特征值是 1+ e 和 l — e , 并且验证在这种情形下的界 
(6. 3. 16). 


习题 

1. 如果 A , / i 是 A 的特征值，证明 A 的相应于 p 的任一左特征 向撥与 A 的相应 
于 A 的任一右特征向#正交. 

2. 在 A 有1：不相同的特征值的假定下，利用上一个习题给出引理 （6. 3. 10) 的另一个证明. 

3. 考察 



「0 in 

•0 1- 

A. = 

6 A 0 = 



-c 0 - 

•0 0- 


其中试验证本节第一段最后一句话中所表现出的遗憾.证明，对 e >0, A , 可对角化， 
11 A , 的- 个特征值与的每一个特征值间的极小距离是 id K . Jf •证明 

1 ■■ 谅•丨 若一 0 

因此 • 一般说来，没有形如丨 A _ A , I 的界可能是正确的.然后计算在这种情形下定理 

(6. 3. 2) 的界，并且说明会出现什么悄形. 

4 - 考察多项式 p (* r ) = (*r — * r。）' ， 它在 有4根，即 〆々 > = 〆（•!••,）= 0， f0 p \ jr KI )= 0 . 
证明，对较小的 e〉0, 有形如 a 土 e 1 2 与 a 接近的两 个根. 因此，一个多项式的各个 

系数中阶 e 的一个改变就可以使它的各个根按阶{的一个相当敏发生改变.对于一个多项式， 
一个零点的扰动与各系数的扰动之比可能是无界的. 

5. 考虑界（6.3.4>，它是说，对于 Hemihe 矩阵（或更•-般地，正规矩 阵）， 特征值的扰动 
与矩阵诸元素的扰动之比是有 界的. 因为矩阵的各特征值正好是其特征多项式的各 个根. 解释 
为何这个合意情形与习题 4 中的结论是一 致的. 历史的经验是，按传统习惯去构造特征多项式 
然后求它的各根的方法来计算 Hennite 矩阵（或任何其他矩阵）的各特征值是不可取的.这有可 


374 


375 
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第 6 聿 


能把原本良态的问题转为病态问题！ 

6. 考虑 Givens 给的例子，设 A = /是2 X 2实对称矩阵，而 


E(e> = 


* ecos (2/ e ) 

-€ sin (2/€) 



—£cos(2/c) 



£>0 


是一个实对称扰动矩阵，且 £：(0) = lim £：( e >=0. 证明 ， A + E ( e > 的特征值是 1+ e 和1一€，而 

•-0 

A + E ( e ) 相应的（唯一确定到相差一个 符号） 的正规化特征向域分別是 「 cos ( l / e ), S in ( l / € ) y 和 
[ S in ( l / e ), - co . s ( l / e )] T , 其中 e >0. 证明，当 e —0时，每个特征向 M 可随意地指向任一给 
定的 方向. 因此，即使我们仅考虑实对称矩阵，如果它的特征值与其他特征值没有明显的区 
別，则有个别特征向 馈酊以 快速地变化. 

7. 试用定理 （6.3. 5>的证法证明，（在该定理的假设条 件下〉 存在幣数】，2,…，《的一个 
排列!■，使得 


(E I I 2 )' 2 ^ HEIU. 

1-1 

H 

提示 ：考虑 min 丨 2^ Ked.^)：C = [ q ] 是双随机矩阵 

• •>-1 

8. 设是绐定的正规 矩阵， 其特征值集为 U ,(.4)}, 乂设 r >0 是给定的，且定义 

S ( A , r ) = {Be M.zB 是正规矩阵，且 || B - A \\ 2 ^ r ) 

证明 U ,， …， Aj 是矩阵 B € S ( A , r > 的特征值集合当 & 仅当 

鳟 

min {2 I A ,( A )- A^o | 2 w 是 1 的一个排列 

••叫 

这给出 r 一个给定的正规矩阵的邻域中的诸正规矩阵的 si 能特征值集合的完幣 特征. 提 示：必 
dzll 要性用定理 （6.3. 5>. 关于充分性， = 其中 A = diag ( A , ( A ) ，…， A „(/ U ), 然后定义 

B = UAU * » 其中 A = diag ( A 】 ， …， 

9. 在定理 （6.3.5) 的证明中，用到了如下 亊实： 如果 U = [« y ]6 M „ 是酉矩阵，则八= 

[ 丨〜丨 2 ]是双随机 矩阵. 说明不是每个双随机矩阵可以用这种方式由两矩阵 产生. 提 示：考 
虑例子 


■110、 
y 1 0 1 . 

L 0 1 1. 

10. 假定是给定的 Hermite 矩阵，且假定用某种方式已求得一个酉矩阵使得 



' 3. 05 

-0.06 

0. 02" 

UAV = 

— 0. 06 

-6. 91 

0. 07 


. 0. 02 

0. 07 

8. 44 


对于 A 的特征值，给出你所能做到的最佳估计. 

H . 不能指望非正规矩阵有形如 （6.3.4) 的界. 考虑 A , E 6 M ., 其中， 
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明 A 的所有特征值都是0，而.4 + £:的特征值是关于 > ^7^的，,个不同 的值. 无论 e >0 为何 
:， 只要适当地选取“，就可使 A + E 的所有特征值任 意大. 当 A 是正规矩阵时，悄况有何 

1口1? 

进一步阅读定理 （6.3. 5) 的原始形式可参看 A . J . Hoffman and H . Wielandt , “The 
Variation of the Spectrum of a Normal Matrixf 99 Duke Math. J. 20(1953), 37-39. 这个结果 
关于实对称悄形的一个初等证明 hlrWU ], pp . 104 109. 

6.4 其他包含区域 

我们 L 1 妗比较洋细地讨论丫 Gersgorin WI fit . 它们 fi f •面上一类特殊的容易计算的 K 域， 
这些 K 域保证包含给定矩阵的各特征 值. 许多作者也许受 GerAgorin 理论的优美几何结构的启 
发，推广 了这个 理论的思想和方法，得到一些其他类®的包含区域.我们讨论其中几个已经成 
熟的宵有特色的结果. 

第一个结果给出了特征值的包含区域，像 GerAgorin K 域耶样，它是若干个岡盘之并，不 
过，则盘的径既依赖于去心行和也依赖于太心 列和. Gerjigorin 定理的分离行和与列和形式 
是作为这个结果的极限而得到的 • 这个结果 H 功于 Ostrowski , W 此它可以看成安插在 （6. 1.2) 
与 （6. 1. 4) 之间的包含区域的一个闭联集. 

6.4.1 定理 （ Ostmwski 〉 ae [0, 1] 是给定的数，乂设尺：和分别表示 
A 的去心行和与去心 列和： 

歸 . 

広 = 2] I 〜I (6.4.2) 

c : = 2丨…，丨 (6. 4. 3) 

i-l 

则八的所有特征值位于《个阓盘的并 


_ 

U 


ue c:i z- Ui 


(6.4.4) 


rh 

* 


证明： 我们可以假定 0< a < l , 当 0 = 0和^=1的情形（相应于关于列和与行和的 
Gedgorin 定理以通过取极限得到.另外，可以假定所有 R :〉0, 因为可以在其尺；=0的任 
一行中添上一个小的非零元使 A 产生 扰动； 所得到的矩阵有包含区域 （6. 4. 4)，它大于 A 的包 
含区域， 并& 在扰动 趋于零 的极限情形推出结论成立. 

_ 现在假定九 r = Ai，&*r = [>,]#0. 于是对每个 /— 1, 2，…， n , 有 

崎 縳 n 

u — “ a II x •卜 1 2 1 a v M j-j= 2 I i*< I r° I u 

/•i >-I > •里 

M * j^i 

lf ； T[S<l“,> I 卜 • U 卜•，广 （ 6.4.5a) 

/ •叫 /-I 

= K；-[V U v IU I 1 " 1 •，]■-•, 

j 參 i 

W 为 <> o , 它等价于 


\ X- a., \ 


^ 丨〜 iu r .f ， 


因而 


I A — In ' " •* " 

^ 1 ] u. r 1 -*iiy .、 


在 （6. 4.5 a ) 中所使用的不等式是 Holder 不等式（附录 B), 其中， p=l/ fl 且 g 
1/(1 -a). 现在对 f 相加 （ 6. 4. 5b) 便得到 


(6.4.5b) 


= />/(/>—!) = 


=EG u 


(6.4.6) 


如果对适合 . r , 关 0 的每个 ，•有 


[^]… 


则 （ 6. 4. 6) 不能成立 . 因此，得出 


[^] — 《 


对适合 A 浐0的至少一个，•值成立，因而 

I A - a B 


ri 41 , 

线习 考虑 A = ，试比较 Gedgorin 行和列特征值包含区域与 a = j 的 Ostrowsi 区 

匕丄 t) J L 
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域.对于 A 的谱半径， Ostrow . ski 定理给出什么估计，且如何同 Gerggorin 估计 （6. 1.5) 进行 
比较？ 

练习推论 （6. 1.6) 的 Ostrowski 形式是什么？ 

下一个结果也是 Gedgoriri 定理的推广，它属于 Brauer , 不过现在一次要取 两行； 几何区 
域不再是圆盘，而是称作 Cassini 椭圆形的诸 集合. 显然, 其证明平行于 Gedgorin 定理的证 
明，其中不仅选择特征向量的一个最大模分董，而且还选择两个最大模分量. 


6.4.7 定理 （ Brauer 〉 设/\ =[〜] A 的所有特征值位于” U — 1 )/2 个 Cassini 楠阆形 
的并 


U U 6 C * | z — a m \\ z — a h I < R \ R ', } (6. 4. 8) 

“/■I 

中. 

证明： 设 A 是 A 的特征值，且假定九 r = A _ r , 其中关 0. 则 i 的一个 元索有最大绝 
对值 • 例如使得对所有《 = …， 《有|心 I >丨 x . 丨且 a 关 0. 如果 I 的所有其他元都 

是零 • 则的假定说明因为 A 的所有对角元都包含在区域 （6. 4.8) 中，所以， 
当它的相应特征向》只有一个非芩元时，特征值 A 在这个区域中. 

现在假定至少存在特征向•的两个非零元， 设心 是具有第二个 ft 大绝对值的分即 
对所有 1 = 1* …，； I ， I •尹 />，且 * r , 关0关 j ,， 有 | 心 I > | | > | jv | • 

于是九 r = A * r 表明 




它躉涵 


I 心 I I A - I = I I ^ ^ I I I x, 1^ 2 I a h I | j, \ = Rp I x, | , 


或 


i 參 P 


i 凑， 


ul </?； 


(6.4.9) 


但是也有 


j ,( A - a w ) = 2 




它蕴涵 


I x, I I A — I = I 左 a〆，I < 2 I a » I I ^ I < 2 I I I I = 尺 ： I I , 


或 


1*9 


I A ~ a w KK ； 

取 （6. 4. 9) 和 （6. 4 . 10> 的乘积使我们可消去 a * 的两个分景的未知比，从而得到 


(6. 4. 10) 
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□ 


u- 〜 iu- 〜 \<K f P rr-f = 

因此，特征值 A 位 r 区域 （6. 4. 8) 屮. 

练习 Brauer 定理的列和形式是什么？ 

关于特征值包含区域的任一个定理蕴涵（并且实际上也被蕴涵于）相关的可逆性定理.现在 
利用包含结果得到不许 e = 0 属于该包含区域的条件. 
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6.4.11 推论如果 A = [〃 v ] eM w ， 则下列条件中的任何一个都是 A 为可逆矩阵的充分 条件： 
( a > 对某个 [0，1 ]， I “ u I ° 对所有 / = 1 ，…， w 成立 ( C ) strowskii ); 

( b ) \ a u \ I a ,, I > R ’, R ’, 对所有/， ) = 1, —, i^/=j 成立 （ Brauer ). 

练习利用 （6.4. 1) 和 （6. 4. 7) 证明 （6.4. U >. 

Brauer 定理要求一次取两行的乘积.在一次取-行或多行的想法启发下，人们注意到进一 
步推广 Brauer 定理的可能性，并且对每个…， w , 考虑形如 

_ m 

JJ I ? - a, k , k I < IT ^ [〜] e M m (6. 4. 12) 

*-» 卜息 

的集合 之并. 对每个有 Q 个这种形式的集合： m = l 给出”个 Gedgorin 圆盘，而 m = 2 

绐出 Brauer 的”个椭 脚形. 遗憾的是 • 对 m >3， 集合 （6. 4. 12>并不一定是特征值包 
含区域 • 正如例 f 

110 0 
110 0 

A = 

0 0 10 
.0 0 01 

所说明的 那样. 对于/” = 3和 w = 4， 集合 （6. 4. 12) 仵点 : r = 2 完全失效. 

练习证明 （6. 4. 13) 中矩阵的特征值是 A = 0， 1, 1和 2. S w = l , "i = 2 和 w = 3, 4画 
出集合 （6. 4. 12>的草 RI . 考虑 

[J 0 1 

A = [ 0 j J 6 (6. 4. 14) 

■] 11 

其中， iJ eM ：， * 且是单位矩阵，证明，对所冇 w >3, 也会出现上述同 
样的现象. 

ft 然这个例子排 除了对 Brauer 定理作最明 g 的推广的51能性，但是它提醒我们，什么样 
的推广可能是错误的，应如何对待.区域 （6. 4. 12) 的问题在于采用了过多项的乘积，其中一些 
项因为 零去心 行和吋 有吋能 为零. 当然，如果矩阵 A 是不可约的，这种情况不会出 能现； 这 
时所有尺: >0. 

然而，即使 A 是不 p 了约的，区域 （6.4. 12) 还可能不是 .4 的特征值包含 区域； 它仍然可能 
采用很多项的乘积.考虑由 


(6. 4. 13) 
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(6. 4. 15) 


给出的扰动及 A •的有向图 r ( A ,>, 其中，当 e = 0 时，虚弧线消失.如果 e ^ o ， 则厂(人>是强 
连通的，且人是不可约的.于是求得 

R \ - 1- H 2 c , R \ = U R \ = e . R \ = e . 


ft A . 有特征值 


A, = 1, 1, l + U+Ze” 12 和丨一 （ l+2e:> 1/2 . 

练习验证关于 A, 的上述计算. 

W 为三项或多项広的任一乘积至少包含 e 的一个《子，所以，当 e 是小的正数时，无论 
对于…= 3还是 m = 4, 集合 （6. 4. 12>都不可能是特征值的包含区域. 

练习考虑 （ G. 4. 丨^的如同形式 （ 6. 4. 15) 的扰动 • 证明上述结论对所有 m^3 成立. 

(6. 4. 13> 和 （6. 4. 15> 的哪个固有性质说明， w = l 和 m = 2 在 （6. 4. 12) 中是可行的，而 w 
-=3和 w = 4 是不可行的呢？ Richard Brualdi 注意到，在每种悄形下有向图都不包含长为3或4 
的 W 路， 但是的确包含 K 为1和2的 M 路.这厣来是得到 Brauer 定理的正确推广的关键所在. 

我们知道，有向图 r 是强连 通的， 当且仅当在 r 中有一条从每一结点到任何其他结点的有 
向 iff 路（并且还有返 W 的有向逍路）. 

我们称 r 是弱连 通的，当 ii 仅当从每个结点到某 个其他 结点有一条有向道路及返回的有向 
道路.这等价于断言， r 中的每个结点属于某条非平凡 回路； 一条平凡回路（或 圈） 是长为1的 
有向 道路， 其起点和终点在 同一个 结点. 

用矩阵来描述，我们知道，厂(4 〉 是强连通的， 当且 仅当 .4 是不可约的.称 a 是弱 不可约 
的，当 r 仅当 ha > 钻弱连通的. 弱不可约性 ft 来不像不可约性冇引人注意的特征描述[用像冓 
换相似那样的变换表示 （6.2. 21b>], 但是，用 A 元素 的芩非 零结构来描述便会得知， A 是弱 
不可约的，当且仅当对每个/=1，…， w ，A 的第/行至少有一个非零非对角 元〜， 使得/\有 
-个非零元序列《#，•••，％、， 适合怂 =>,和匕 =/• 这个麻烦的条件大约是 A 有 
性质 SC 的条件 （6.2.7) 的一半，为 r 计算上的需要，或许用类似于定理（6.2.23〉的形式来叙 
述更为方便. 


6.4.16 引理 如果则 A 是弱不可约的，当 M 仅当矩阵 

( a ) fi = [/+ I A 丨 ]” •或 

( b ) B = [I + M ( A )]-- 1 

中的任何一个有性质：对每个/=1， …，〜 在第/行至少存在一个非零非对角元关,)， 
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使得~也是非零的. 

练习证明引理 （6. 4. 16). 提示： 利用 （6.2. 19>中的思想 

练习假定设 fieM ■定义为（6.4.16)中的（ 3 )或（13).证明， A 是弱不可约的当 
且仅当尸(/3)有 性质： 每个结点属于长为2的回路.关于不可约矩阵的相应性质是什么？哪个 
性质更弱？根据定义可知，一个回路是简单的，如果只有它的起点（这也是终点）在结点表中可 
以出现两次以上. 

练习如果是弱不可约的，证明所有尺:〉0和所有 C :〉0. 

集 s 上的一个预序是定义在 s 的所有点对之间的关系尺，使得对任一对元素5, / es , 有 
或/仏，或者两者都 成立. 一个预序一定是自反的对每个成立）和传递的（如果 
*7?/ 且 A “，则—个预序可能不是对称的（只要 就有 sRt )， 而且还可能有 Ar 且 
此， 而无 s = r . S 的子集 S 。 中的点 sr 称为 S u 的极大元，是指对所有 成立. 

练习设 S 是复数域的任一非空集合•用 

当且仅当 | z |<| u ;| 

定义的复数对 h 之间的关系 g C 上一个预序. 

6.4.17 引理设 S 是非空有限集，在 S 上定义了一个 预序. 则 S 至少包含一个极 大元. 

证明： 把诸元素排成任意顺序〜，…， a , 令5=〜.如果&仏，就衔下 s , 否则就令 
384] 52 .对余下 的元素 继续这样做. s 的 W 后值就是极 大元. □ 

如果 r 是有向图，且尸是 r 的一个结点，定义 / v / o 是由不同于 p 的结点组成的集，且 
从 p •经长为1的某条有向道路可以到达其中每一个结点.注意，如果 r 是弱连通的，则对每 
个结点尸 € r , /\(以是不空的. 

让我们用 c ( a > 表示有向图 r ( A > 中的诸非平凡冋路 y 的 集合. 一条非平凡回路是至少包含 
« 个不同 结点的回路：即它是（简单 有向） 回路，而不 是圈. 对于矩阵 （6. 4. 13)， C ( A ) 只包括 
—条冋路7=戶,户 2 , P 2 P «, 而对于矩阵 （6. 4. 15)，则有三条分离的非平凡回路，其长度都 
是 2. 


6.4.18 定理 （ Brualdi ) 如果 A = ]6 M ■是弱不可约的，则 A 的每个特征值包含在区域 

U I 2 ^ C ： JJ | 2-^ |< JJR ： } (6.4.19) 

Rer p er 

中.记号是说，如果…，匕厂…是非7凡回路:且则在 （6. 4. 】9)中的 
每个乘积恰好包含々项，且下标 ? •取 ，* 这々个值 • 

证明： 假定 A 是 A 的特征值，且对 A 的某个主对角元有 a =〜. 则 A 显然在区域 （6. 4. 19) 
中. 实际上，因为 A 是弱不可约的，所以 所有 〆 >0, W 而在这种情形， A 位于区域 （6. 4.9) 

内部. 如果 A 的每个特征值都等于 A 的某个主对角元，则 A 的所有特征值都在区域 (6. 4. 9) 的 
内部，于是定理得证. 

关于其余情形的证明，假定 A 是 A 的特征值，且对所有,=1，…，„， a 关设 
对某个非零^ = 0,]60：” 成立.在厂的诸结点上定义预序 R 为 

尸尺尽，当且仅当丨 _ r , |<| x , |. 


(6. 4. 20) 
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要证明，在 r ( A ) 中存在回路/,且具有以下三条 性质： 

(a) y - P, t p , 2 . C 3 , …， P ••/ \ + ，是非平凡（简单有向）回路， 

其中々彡2且尸•…=矸. 

( b ) 对每个 ）= 1, …， K 结点 P . i + ，是/ VP ,，> 中的极大 结点 ； > 

即 u | 对所 有使氏 e / v ^ v 的切 成立. 

( C ) 所有 JCi.^Oy >=1, — , k . 

如果/是适合条件 <6.4. 21>的回路，则 ArsAi 推知，对任意 ）= 1, …， I 有 


(6. 4. 21) 


(A-a v . )j- t/ = Yj a ^ r x - = S • 

卿二 1 WV 


因而 


U 飞 .， 丨 I ' I = I Yj a > r s - I ^ S U, 」 I I」 

〜 er n ( p .,, W ,,， 

< S I 卜•…丨 

= Ov I . 

如果现在在/的所有结点上取不等式 （6. 4. 22) 的乘积，便得到 


IT I A-ci v ； | | |< JlR r I |. 

!• I ••• I 


但是 


TTu - a , j . nM-.i 和 W^w， 
乂因为/^,=弋，还有因此， 


(6.4.22) 


(6.4. 22a) 


(6.4.23) 


IT I I = II I J v ， I 关 0 . ( 6 . 4 . 24 ) 

>«i >-i 

于是，用 （ 6 . 4 . 24 ) 除 （ 6 . 4 . 23 ) 便得到 

n u - “” n 尺 ：. ( 6 . 4 . 25 ) 

W 为 / 是厂 (A) 中的非平凡冋路，所以特征值 A — 定位于区域 （ 6 . 4 . 19 ) 中 . 

现在应该证明，必存在适合条件 （ 6 . 4 . 21 ) 的回路 /• 设 I• 是使 x • 关 0 的任一 下标： 于是从 
恒等式 


(6. 4. 25) 


(A — a B )* r , = = 2 

>=； WP 

以及々^0和乂一〜关0的事实得知，左边非零， W 而在厂*(尸>的诸结点中[这些严使 a , ，关0 
且因为 r ( A ) 是弱连通的，所以 IV (尸）非空]一定至少有一个结点，使得相应的特征向 
M 分量非零.设巧三尸， 又设匕 是1\(弋> 中的诸结点中的极大结点，即|礼 | ^ | ^ | 
对所有使 ) 的爪 成立.我们可保证 X., 关 0. 


假定上述构造法已经得到 K 为 ）一1 的有向道路斤 P .,， …，且适合 
(6. 4.21) 的条件 （ b ) 和 （ c >; 刚才已对 j = 2 这样做 r . 于是 

( A - a V / ) j - f> = 2 “―， 

且左边非零，因而 ft (厂中一定至少存在一个结点[因是弱连通的，所以厂4(广)非 
空]使相应的特征向《分搶 非零. 因此，如果选取/\ ，为厂 的极大结点 • 保证有 
关 0 . 7 

因为在 J ’( A ) 中只有有限多个结点，这个构造法依次取）= 2, 3,…，最后会得到第一个 
极大结点 f (/\ ,)，它是作为前面某一步的结点尸,，得來的 W 此 y '= 

P , P ^ r P lptx P ,^ . /\_,/\是厂(4)中的回路，且适合 （6. 4.21) 屮的所有三个 条件.口 

当 A 实际上是不珂约的时候. Bruddi 定理有较强的形式 • 它足推广 Br aU er (6.4.7> 的定理 
(6. 2. 26) 的形式. 

6.4.26 定理 （ Brnaldi ) 设 A = [“ v ]€ 是不可 约的. 则对每个非平凡冋路 C ( A ) ,只有 
当各 个粢合 

{^6 C ： JJ I :一 l < 11^：} (6.4.27) 

的边界都经过 A 时，区域 （6.1. 19>的边界点 A 才可以是 A 的特征值. 

证明：因为所打 <>0，如果 A = a 对任 一 / = 1, 2，…， w 成立，则 A 不可能在 K 域 
(6. 4.27) 的边 界上. ㈥ 此，可以假定，对所行/=丨， …， „ 并 tl 可以继续采 JIJ 

1^仙1出定理（6.4. 18) 中的证法以及相同的记 号, 但是需另外假定 A 是在区域 （6. 4. 19>的边界 
1的 A 的特 征值. 正如在引理 （6.2. 3>的证明中所证明的，对所的 备非平 凡问路 yeC ( A>，A 
必定满足不等式 

n u - n 尺： 

闕 「其中等式对至少一个 y 6(’(/ U 成立] • 把这个不等式与 （6.4. 25>作一比较.得知 

IT U -1= n 尺：， （6.4.28〉 

其中/是在（ 6 . 4 .】8>的证明中所构造的特殊 回路. 因此，（ 6 . 4 . 23>中的不等式一定是等式，从 
Ifli 对所打）= 1，2, …， 々• （6.4.22) 中的两个不等式一定是 等式. 特別是，不等式 （6. 4.22 a ) 
一定是等式，因而对 每个、 和对所冇使 P _ e / V (尸 ,,） 的 m , | x ,. | = | x </(| I ：= c , ,=常 
数. 注意，这个结论对适合条件 (6. 4.21) 的任一间路都 成立. ，M ^ 

现在定义集合 

K = {P f e r ( A ) * I I = r ,= 常数对所有使匕 e 厂悴 （ 尸 > 的 w 成立 >• 

因为 〆 的所有结点都在 K 中，所以 / C 不空. 我们想要证明 r ( A ) 的所有结点都在 K 中. 

假定 r ( A ) 的结点尸 7 不在 fc 中.因为 r ( A ) 是强连通的，所以在 r ( A > 中，从 k 的每个结 
点到这个外结点至少存在一条有向道路.如果从所有这些有向道路中选取长度嵌小的道路， 
则它的第一条弧一定是从 k 中的一个结点到不在 ac 中的结点 p , 的弧.如果在 r (/ u 的结点上 
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采用定理 （6. 4. 18) 的证明中用过的相同预序，则可以使用在定理 （6. 4. 18>证明中用过的相同构 
造法；从结点 = 开始，选取极大结点尸,，6/\(广，），选取极大结点尸,,6/\(6 2 )，如 
此等等.因为厂(/\〉是弱（甚 至强〉 连通的，所以，在每一步非空，乂由于如前所述的 
相同理由，极大结点适合 （6. 4. 21) 的条件 （ c >. 

如果在这个构造过程中的某一步，在选取极大结点当中，可以选择在 K 中的或不在 K 中 
的结点•那么就总选取不在 K 中的耶个结点.如果在仔一步中.可供选取的所有极大结点都 
在 K 中，那么就在它们中任选一个 • 然后沿着（一定在 K 中的）长度 ft 小的有向道路到不在 K 
中的第一个结点上；并 旦如前 继续选择极大结点.根据 K 的定义， K 中任一条有向道路将異 
有 性质： 每个结点是它的前一结点在/ V 中的极大结点 [(6. 4.21) 的条件 （ b >]. 因为 K 的补集 
只有苻限多个结点，这个构造法终究应该得到 K 的补集中的第一个极大结点，它是作为前面 
某一步的一个结点得来的.对于这个构造法中的这个 结点， 在它第-次出现与第二次出现之间 
的有向迫路将是一条非平凡的有向回路，这条有向回路坷能不是简单的，这是因为当这个构造 
法选出 K 中一结点时，我们就选一条由该点到 K 外一结点的有向道路.在位于 K 中的那部分 
道路中，可能有有限多条 W 路，供是可以刪去它们而留下一条简单回路/，/适合条件 
(6. 4. 21) 且至少包含不在 K 中的一个 结点. [388] 

因力回路/适合条件 （6.4.21), 所以可以用它来代锊定理 （6. 4. 18) 证明屮 的凹路 /. 根据 
本证明的第一段中的论证，得知，对所有 P , ,6/， 丨心丨 =9=常数对所有/^€厂（/^)成 
立. W 此 〆 '屮的每个结点在 K 中，这与/至少包含不在 K 中的一个结点相矛盾.这就证明了 
厂 ( A > 不可能有不在 K 中的仟何结点. 

如果 y 是 r ( A > 中任一条非平凡（简申.有 向） M 路， W 为它的所冇结点都在 K 中，所以它白 
然适合条件 （6. 4.21). 因此可以用它代 转定理 （6. 4. 18) 的证明中的 〆 ，从而也可以用它代替 
( 6.4.28)中的 /• 这就是所要证的 结论： 每个集 （6. 4.27) 的边界经过 A . □ 

6.4.29 推论如果则 F 列条件中的 If 何一个是 A 为可逆矩阵的充分 条件： 

( a ) A M 弱不可约矩阵 • 且 

II U" l> T1 尺： 

对每条非平凡冋路 yer ( A ) 成立： 

( b ) A 是不可约矩阵 ， R 

rr 丨 …I 彡 n 尺： 

Mr ^ r 

对每条非乎凡 H 路 y 6(’( A ) 成立，其屮严格不等式对至少一条回路成立. 

习题 

1. 证明，如果矩阵八=[^]适合关于^ 3 11打可逆性的条件（6.4.111>),则除 f :=1，…， 

"的至多一个值以外，都有丨 “ u 丨 > R \. 因此， Brauer 条件只是比关亍严格对角占优性的 
Levy - Desplanques 条件 （6. 1. 10 a > 稍微弱一些.这与 （6. 1. 11>是什么关系? 

2. 证明，根据 （6.4. 11) 中的两个条件 ， A = 2 1都是可逆的，不过不是 Levy - 

-1 3 J 
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Desplanques 条件 （6.1.10 a ) 也不是 （6. 1. 11) 确保其可逆性 •（6. 1. 11) 的列形式是什么? 

3. 证明，对于每个不可约矩阵是弱不可约的.试给出一个例子，它是弱不 
[389] 可约矩阵而不是不可约矩阵. 

4. 给出推论 （6. 4. 29) 的证明 细节.提示： 采用（6.1.10〉和 （6. 2. 6) 中的相同证法. 

5. 证明， A 6 M , 是弱不可约的，当且仅当 A 不置换相似于其一个对角子块是 1 X 1 的分 
块三角 （0. 9. 4) 矩阵. 

进一步阅读关于包含区域的详细说明以及许多原始文献可参看 R . Brualdi , M Matrices , 
390] Eigenvalues , and Directed Graphs ，" Li ”. Multilin . Alg . 11(1982), 143-165. 
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一类具有特殊正性的 Hermite 矩阵常常出现在许多应 用中. 具有这种正性的 Hermite 矩阵 
(特别是实对称 矩阵〉 可以看作正数_念到矩阵的 推广. 这样考虑常常可以深人理解正定矩阵的 
一些性质和 应用. 下面给出这方面的-些例子，其中就要出现这些特殊的 Hermit 矩阵. 

Hessian 矩阵，极小化和凸性 

设 /(•!•) 是某区域 DCIR ” 上的光滑实值 函数. 如果: y =[： y ,] 是 D 的一个内点，则 Taylor 定 
理说明， 

/(• r ) 

m 

十2 (j< 一 乂 ）（ 1> 一乂） 

“i-i 

对 y 附近的点』成立，如果 J 是/的临界点，则所冇一阶偏导数在: V 点为零， W 而，关于 
/在^附近的性态，有表示式 

/( j ) -/(^)= y ,)( x f - y ,) 

= (x — y) T H (f ； y)(x — y) ^ 

wXr * 矩阵 

称为 / ft ： V 点的 Hessian 矩阵； W 为 / 的混合偏导数相等，所以它是对称矩阵.如果二次型 

z T H ( f ； y ) z , 2 0,2 6 R " (7.0. 1) 

总是正的，则 y 是/的相对极小点，如果这个二次型总是负的，则 J 是/的相对 极大点 .当 
然，如果这个二次铟对所有非零可能没有确定的符号，在这种情况下，临界点 y 的性质 
就不确定.在 m =1 的情形，验证相对极小点或极大点的这些准则不过是通常的二阶导数检验 
法.对于 n = l , 第三种可能性只在拐点 出现； 当 n > l 时，情况可能要复杂得多. 

如果二次型 （7.0.1) 在 D 的所有点（不只是在/的临界点）非负，则/是 D 中的凸函教.这 
是《=1的熟悉情形的直接推广. 

方差-协方差矩阵 

设：^， X 2 ，…， I 是在某个具有期望函数£：的槪率空间上的具有有限二阶矩的实或复 
随机变量，且假定广=£：(；0是相应的平均值.随机向董 X = ( X ,， …， X ，） 7 ■的协方差矩阵是 
矩阵/\ =[七;1，其中 




网 


a„ = £[<X, — fn)(X, — /i> )] t i，j = 1 ， ". ， w. 
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M 然， A 是 Hermite 矩阵，并且容易算出，如果 d >,]6 C ”， 则 

z' Az = E[ 2] z.CX, — ^ i )z > (X i — ^ ; )]= E \ ^ 0. 

i .>-1 •■"屋 

在这个结论中所涉及到的期望函数的仅冇性质是它的线性、齐性和非负性三个性质；即只要 Y 
是非负随机 变世， 就有 t ’[ y ]> o . 

不借助槪率术语也可以作出同样的 结论. 如果在直线上有一族复值函数，，/ 2 ,…，八， 
_ 如果#是实值函数，又如果所有积分 

a,j = J i^j — 1 •…， w 

部冇定义 XL 收敛，则矩阵 A = [^] 显然是 Hermite 矩阵. 容易算出， 

z ' Az = ^ f I j 

w〆 .. • J •• i«i 

因此， 如采# (•/•) 是非负函数，则这个二次®就是非负的. 

非负函数的代数矩 

设 / UO 是单位 K 间 [0, 1] 上的绝对珂积实值函数，并 fl 考虑数 

«* = J . r */(. r ) d . r . 

序列认 , ， ci 2 , … 称为 HausdorH 矩序列，且它自然与实二次 ffl 

= V X , k z,z k f{jc)ds = [ ( ^z k x k Y f(x)ds 

/.k" o /.k^tr v 0 *-0 

有 联系. 如果令则 A 就是实对称矩阵，乂如果对所有 * re [0, 1 J 有/(^)>0,则 
对所冇 Z 6 W , 将有 zMz >0. 这对每个《=丨，2,…都成立，不论其二次型是否非负，具 
冇/\的结构的矩阵（即元索 〜只是 /+) 的函数）称为 Hankcl 矩阵.阽（0.9.8〉节. 

非负函数的三角矩 

设(仍是 [0, 27 T ] 上的绝对可积实值函数，并且考虑数 

山走=士 1, 士 2, …. （7.0.4) 

3 p ] 序列，“，， u ,， ci 2 ， a 2 , …称为 Toeplitz 矩序列，并 fi 它自然与二次型 

忘 a 卜 … i k f(d)dd = J'" I 2^^ I ： f^)dd (7.0.5) 

有联系，如果令则 A 就是 Hemiite 矩阵，乂如果对所有沒 e [0, 2tt] 有 /( W 彡0, 
则对所有将有， Az >0. 这对每个”=1，2,…都 成立. 不论其二次型是否非负，实 
有 A 的结构的坧阵（即元素^只是 / 一） 的函数）称为 Teoplitz 矩阵.见 (0.9.7) 节.亊具上，对 
公式 （7.0.4) 稍加修改（其中，非负测度 < 代替 /( 幻必），则二次《1(7.0.5)是非负的，当且仅 
当 A 由修改后的公式得出 （Bochner 定理）. 

关于微分方程的数值解的离散化和差分法 
假定我们有形如 

一 y(j> + tr( j*>jy(.r> = f(j-) • 0 ^ j ^ 1, 


(7. 0. 2) 

(7. 0.3) 
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yiO ) = a * 
v ( 1 ) = ^ 

的两点边值问题，其中， a 和是给定的实常数，/(^)和是给定的实值 函数. 如果我们把这 
个问题离散化，且只求: yaWEA 的值，々 = 0 , 1,…，71+1,又如果利用均差逼近导数项 
" { 、〜： y ((々 + 1 )方> — 2 y(.kh ) -f : y ((务 —\) h ) _ y k ,i — 2 y t + 3V1 

耶么，就得到线性方程组 

一外 1 V ^ yk ~ ^ 1 + m ： y t = f k 、k = 1，2,…，《， 


yo = a * 
y^i = A 

这里，对于正幣数 m , 可以取 /* = 1/ U +1>, y k = y ( kh ), 办 = eT ( M ) 及可以把边值 
问题编人第一个 a = i > 方稃和 最后一 •个 U = W > 方程 | fti 给出方程组 [M 

(2 + h 2 (ji ),vi — A = 厶 2 ,1 + a ， 

— yk~i + (2 + h 1 a k ) v* 一 >1 = /r/* • 走 = 2,3 ,…，”一 1 • 

一 >V I + (2 + h : a H ) y „ = h ' /„ 4- 

还可以更紧凑地把它写成义 y = u ，， 其中 . v =[： y *] eR ' u ，=0 2 /,+ a , h 2 f 2 ，…， h 2 f "、， 
h 2 f „+ pyeR \ 且 AeM n 是三对角矩阵 

「2 + 以 一 1 I 



2 + h z oz 


0 


(7. 0.6) 


0 一丨 2 + W , -1 

. 一 1 2 十以 _ 

应该指出，不论 a (* r ) 为何值 • A 都是实 对称三对角矩阵， （ P . 是，如果希望 A.v = u ，对右边任意 
给定的值都是可解的，耶么必须对 a (* r ) 作某些限制以保证 A 是非奇异矩阵. 

容易算出相应于 . A 的实二次铟： 


/At = [I? + k(J*. - J-iM y /*' ^(J.x'U 

肅 =1 

等式右边中的括■内各项之和是非负的， a 只冇当了的各分 w 都相等，乂 都等子 零时它才可能 
为芩.如果 ( T (* r »0, 则后一个和式是非负的，且 


J T Ad > [« r ; 十2 - JVh >? 0. (7. 0. 7) 

1=1 

如果/\是奇异矩阵，则存在某个非零向 MiG R ” 使得 A 多= 0,因 rftUM : = 0. 另一方面， 
(7.0. 7> 中括号内各项之和必定为零，由此推出 i = 0. 因此 • 如果 a (. r »0, 则矩阵 A 非奇异， 
且离散的边值问题对任意边界条件 a 和/?都是可解的. 

这是在研究常微分方程或偏微分方程的数值解时的典型情形.为了计算上的稳定性，最好 
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是设计一种方法能把微分方程问题离散化，使得在所得到的线性方程组 = w 中 A 是正定矩 
阵，而当微分方程是椭圆型时，通常可以做到这一点 • 

；3951 在上述这些例子中所列举的矩阵具有特殊的正性，这正是本章要研究的对象.这些矩阵出 

现在许多应用中：调和分析中，复分析中，力学体系的振动理论中，以及矩阵理论的其他领域 
(例如奇异值分解和线性 M 小二乘方问题 的解） 中. 

习题 

1. 如果序列 〜是由 非负函数/通过公式 （7.0.2) 产生的，证明 

n m 

^ a . t ^ iz . z , 和 { a ,^ — } z , z J9 z = [ z ,] 6 R " 

一 l I 

都是非负的. 

2. 用示意说明 Hankel 矩阵中哪些对角线取常值.对 Toeplitz 矩阵作同样的说明. 

3. 证明， （7.0.6) 屮的矩阵 A 总是不可约的，乂如果 WhSO , 则它是不可约对角占优矩 
阵.试用推论（6.2.27〉证明， A 是非舒异矩阵 ， tt A 的所有特征值是正数. 

进一步阅读 关于实正定矩阵的一个简短的综述可参看 C . R . Johnson , "Positive 
Definite Matrices , Math . Monthly 77( 1970), 259-264. 关于一般正定矩阵的其他综 
述以及冇关这方面的大批参考资料可参矜 （). Taussky , “Positive Definite Matrices , M pp . 
309-319 of Inequalities , ed . ()• Shisha * Academic Press , New York , 1967; 以及 
(). Taussky /* Positive Definite Matrices and Their Role in the Study of the Characteristic 
Roots of General Matrices ， Math . 2( 1968), 175-186. 

7.1 定义和性质 

设 A fi « X ” Hermite 矩阵，如果对所有非零 C ” 有 

• r . Ar >0, (7.1.1) 

则称 A 为正定 矩阵. 如果 （7.1.1) 中所要求的严格不等式减弱成， At >0, 则称 A 为半正定 
矩阵. 在这些定义不等式中隐含#这样的 亊实： 如果 A 是 Hermite 矩阵，则 （7. 1.1) 左边总是 
实数. 当然，如采 A 是正定 矩阵，则它也是丰正定矩阵. 

[3961 练习当《=1时，正定矩阵和半正定矩阵意味蒋什么？ 

练习证明，如果 A 6 M ，， 且对所有是实数，则 A 是 Hermite 矩阵 .w 
此， A 是 Hermhe 矩阵的假定在正定性定义中不是必不可 少的. 但是，一般习惯这样定义•提 
示： 把 A 写成其中 B 和 C 是 Hermite 矩阵. 

练习说明，如果是实矩阵，且对所有非零 iMo •是正数，则 A 不一定 
是对称矩阵， W 而它不一定是正定矩阵. 提示： 考察实斜对称矩阵 A , 然后计算 （《 r T A * r ) T .在 
这种情形是什么？对于非实 I , •乂如何呢？ 

练习证明 D | ;是半正定的，但不是正定的. 

练习证明，如果 A = U ,]6 M „ 是正定矩阵，则 A = [&]， A 7 *， A •和 A — 1 也是正定矩 
阵. 提示： 如果 A^y = j ， 则， A 、. 
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类似地，可以对 A 定义 负定 槪念和 半负定 槪念，这只要把正定和半正定的定义中的不等 
式颠倒一下即可，或等价地，分別把一 A 定义为正定矩阵或半正定矩阵.因此，关于负定矩阵 
的任何一个命题都对应正定矩阵的一个相应命题.如果一个 Hermite 矩阵不属于上面提到的各 
类中的任何一个[即，如果 （7. 1.1) 左边既可取正值也可取负值]，则称它 为不定 矩阵. 

关于正定矩阵，可以作出几个盘接的结论，并且对于半正定矩阵，也有类似的结论. 

7.1.2 论断正定矩阵的任一主子矩阵也是正定矩阵. 

证明： 设 S 是 {1. 2,…，的真子集，且用 A ( S > 表示从正定矩阵中划去其行号 
和列号分别为 S 的补集的若干行和若干列后得到的矩阵.于是， A ( S ) 是 .4 的主子矩阵， R 所 
有主子矩阵以这种形式出现：我们知道数 det 是 A 的主子式.设是这样一个非芩 
向其中以 S 为下标的分 tt 坷取任意元，而其余分*为零元.设 HS ) 表示从 j ■中划去以 S 
的补集为下标的（零）分贵后得到的向 M ， W 而得到 

jt ( S ) * A ( S ) jr ( S ) = x * Az - >» 0. 

因为 I ( S > 关0是任意的，这表明 A ( S ) 是正定矩阵. □ _ 

练习证明正定矩阵的诸对角元是正实数. 

7. 1.3 论断任意两个同阶正定矩阵的和是正定 矩阵. 更一畋地，一些半正定矩阵的作负线性 
组合是半正定矩阵. 

证明： 设 A 和 Zi 是半正定矩阵，乂设“、因 Ifli 对任意 * rec * 有^ (cM +x = 
«(， A * r )+ M ， Rr >>0 •多于两个矩阵的情形丑按同样的方式处理.如果诸系数是正的 ， A 
和是正定矩阵，乂如果 r 是非芩向 M , 则和中的每一项都是正的，所以诸正定矩阵 的正线 
性组合 fi 正定矩阵. □ 

W 此，正定矩阵的集合在所有矩阵组成的向 W 空间中是一个正锥. 

7.1.4 论断正定矩阵的每个特征值都是正实数. 

证明： 设 A 是正定 矩阵， 设 A € a ( A >， li * r 是 A 的相应于 A 的特征向 M . 经计箅 ，， Ar 
= j *- Ax = A ^- x . 因此 A = j •是正数，因为它是两个正数 之比. □ 

7.1.5 推论正定矩阵的迹，行列式和所有主子式都是正数. 

证明： 迹与行列式恰好是诸特征值的和与积，余下的结论可由 （7. 1.2) 推出. 口 

维习证明半正定 阵的诸 特征值，迹，行列式和各主子式都是非负的. 

练习证明，" X ”负定矩阵的诸特征值和迹是负数，但是 • 对于奇数〃，其行列式是负 
数，对于偶数/ I ,其行列式是 正数. 

练习证明，如果 A =[ 心] € Af 2 是正定矩阵，则“„“ 22 〉 U , 2 丨 2 . 提示： 利用 detA > 

0. 证明，如果 A 6 M ,, 是正定矩阵，则对所有/，）= 1，2,…， m , i 爹 j , 

a B a u > I I 2 . 

证明，如果只假定 A 是半正定矩阵 • 则在上述不等式“ > ”必须换成_ 

7.1.6 论断设是正定的.如果 C € M _, 则 （：• AC 是半正定 矩阵. 另外， rank(C 
AC ) = rank ( C ), W 而， （：• AC 是正定矩阵当且仅当 C 有秩 m . 
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证明： 首先指出， C-AC 是 Herinite 矩阵.对任意了€<：'有， （：• ACr =：y• A：yX)， 其 
中 v^Cr， 而不等式是从 A 的正定件推出 来的. 于是，是半正定 矩阵. 另外， A 是正 
定矩阵，所以得知， AC.r>0 当且仅当 C > 关0,只要能证明 ， CT ACr = 0 当且仅当 Cr = 
0,则关于秩的论断 （ WIW 关于正定性的 论断） 也将得到证明，因为这将表明 CAC 和 C 有相同 
的零空间（因而它们也有相同的 秩）. 如果 Cr =0, 则显然有 （ T . 40 = 0,反之，如果 C'\4C：r 
= 0,则 ，dCr = 0, W 而（如前，利用 A 的正 定性） 得出 Or = 0. □ 

练习如果是半正定矩阵 ift ] 不是正定矩阵，乂如果证明总是半正 
定矩阵社不是正定矩阵.如果 且 / z ^ m ， 用例子说明，即使是奇异矩阵， 
CT AC 也可能是正定矩阵. 

练习 证明由正定（半正定）轵阵组成的锥在’相合 F 不变.见 (4.5.4). 

练习 设是 Hermite 矩阵. 证明， A 是正定（半正定）矩阵，当 R 仅当存在非奇异 
矩阵使得 C ^ AC 是正定（半 正定〉 矩阵. 

如果舍去 A 是 Hermite 的条件，并 (1 定义的二次型< 7. 1. 1 ) 中只采用实变童，这会出现什 
么悄况呢？如果 A 是 H 有实元家的矩阵， H * reR \ 则 iTAj •是实数，但我们仍然可能要问， 
对所有 j •关0,哪咚矩阵有卩使 A 不是对称矩阵 >. 如果 A 是 ft 有 SZ 元索的轵阵，或 
者如果允许 j 则可以用 

Re(j * Ai ) >0,其屮所有非零 j € CT 
来代替 (7. 1.1). 定义 A 的 Hermite 部分为 

HCA) = y(/\ +A* ). 

气 w = l 时，这正好 数 A 的实部. 

练习 kl : 明， （7. 1.1。 成立， 当 fl 仅当正定矩阵. 

练习 证明. 对任意 M ,. A = //( A )- fS ( A ), 其中 S (/\> = |(A — A * )是 A 的斜 

[39^1 Hermite 部分. 

习题 

1■设是丰正定矩阵证明，， A』=0 的必要充分条件是 Ax = 0. 由此推 
出，一个半正定矩阵有秩;;，当 H 仅当它是正定 矩阵.提示： 考察二次多项式 />(/> = 
( j - h /. y )' A(x + ty ), /€： R . 如果 j = 证明，对所冇/，/>(/)^0, /»(0) = 0, 

时， dp / d / = 0. 由此推出，对所冇 . vGC ”， y 9 Aj - = 0, 因而 Ar = 0. 

2. 证明，如果半正定矩阵在主对角线上有零元，则它所在的整行和整列必定是零. 

3. 证明 • 如果正定矩阵的主对角元都是+ 1，则矩阵的所有元的绝对值以1 为界. 可以等 
于1吗？ 

4. 证明，半正定矩阵 A 有秩1,当且仅当对某个非零向 M ^ r , A 具有形式 

5. 设/\ = [心] 是正定矩阵_证明，矩阵是正定矩阵，它的所有主对 
角元都是 + 1，且它的所有元的绝对值以丨为界.这样的矩阵称为相关矩阵. 提示： 求一个经 
某个实对角矩阵的相合. 


(7. 1. 1’) 

(7. 1.7) 
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6. 如果 A 有实元素，证明，对所有非零 • rGR ”， 要求 i T A . r >0 的条件只与有关 • 

7. 证明，与 <7.1. 2)、 (7. 1.3). (7.1.4) 和 （7.1.6) 类似的各个论断对使得 H ( A ) 是正定矩 
阵的矩阵 AeM ,,( C > 成立 • 

8. 设/: R — C 是一个函数，如果对所有71=1，2,…和所有选定的诸点 U ,， 心， …， 

aKZR ， 矩阵 [/( a — 弋）] 6 M , 是半正定矩阵，则称/是正定函數.证明， 对所有 j 々 R ， 
/( 一 利用苹正定矩阵的行列式非负这一奉实证明，如果/ 是正 定甬数.则 

( a ) /(0)^0, ; i = l ； 

( b ) / 是有界函数，且对所有 I fU ) I </(0), w = 2； 

( c ) 如果 / 在 0 点连续，则/处处连续， w = 3. 

9. 如果/，(了）， / 2 ( J "), …，/_(1)是正定闲数 ，“， ，“ 2 ,…，^是非负实数 • 证明函数 
f ( x )= a l f l (« r ) + … + a „/ fl (* r ) 是正定函数 • 

10. 证明，对两个给定的 /6 R , 闲数是正定函数.试用习题9证明，对任意选定的诸 
点6，…，和任意非负数⑷，…，“*， /(： r >= … 十…十 a * 〆〆 是正定 函数. 

11. 证明函数 cos (* r ) 是正定闲数.提示： cos ( j *) = (^ -he u )/2. 

12. sin (^) 是正定函数吗？ 

»3. 如果私 (* r)fi R 上的非负可积涵数 • 证明闲数 

JU ) = J 〆 、(/>“/ 

是正定函数. 提示： 利用定义. 

14. 证明闲数 /(. r ) = l/(l id 是正定 闲数.提示： 在习勉13中，对/〉0, 设以 /) =，，， 
对/<0，设 g (/)=0. 

15. 由定理 （7.5.3 > L 另％ 7.5 节习题 2] 可知 • 如果 /(* r ) 和 g (. r ) 都是正定闲数，则 
/(«2) K (> r > 亦是正定函数.证明，如果 /( d 是正定闲数，则 /(•/*) 和 | /(« r > 丨 2 亦是正定闲数， 
然后利用后一个结论由习题14推出函数1/(1+/>是正定函数. 

16. 利； IK 7.0.2), (7.0.2) 以及= 1 证明，对所有 „=1, 2，…，矩阵 A =- [〜] 

(其中， ㈦ = 1/(，+) — 1)，，•，）= 1，2,…， 《) 是止定矩阵 • 

17•证明，对所有2，…，矩阵(其中 ，心 = l /( i •十））， I, > = 2, 

…，，/)是正定 矩阵.提示： 对所有 . r = 0,] eFT , 

| ( (2^ h Ydt ^0. 

计算这个积分. 

18 - 利用 （7. 1.6) 证明，矩阵 A = U y ]6 iVU 其中是正定 矩阵. 提示：对„ 
= 4,这个矩阵是什么？考察相合 CAC ， 其中 C 是实矩阵， 

' 1 — 1 一 1 … ―11 
0 1 0 … 0 


•• 0 


400 


C = 


_0 


0 


e m , 
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C 为什么是非奇异的？注意这个相合相当于从 A 所有其余的行（列）减去第一行（列） . 现在知道 
了在 C ' AC 的右下方 U —1>\(〃一1)子矩阵的形式，再用同样的方式对它实施一个适当的相 
合来化简这个矩阵.由此得出相合于 /. 

19. 利用习题18和极限证法证明，对任意 N >0, 核 / C ( 5 , r ) = min { s , 0在 [0, / V "]上是 
半正定的，也就是说，对于[0, N ] 上的所有连续复值函数 /(•> ，有 

⑴ /(’) d « l ’ > 0. (7. 1.8) 

提示：用等距点划分 [0, N ], 然后把这个枳分表示成各个划分上的 Kiemami 和的极限. 

20. 证明恒等式 


d/ 


J J min{5./>7(s)/(/)dsdr = J |J f(s)ds 

对 [0, / V ]上的所有复值连续函数 /(•) 成立，然后用它给出习题19中的论断的另一个证法•这 
个证法给出 KO , /) = min {5, /} 是正定的较强的结果：即 （7. 1.8) 中等式成立，当且仅当 /( f ) 
= 0. 提示： 把二歃积分表示成累次积分，然后用分部积分法. 


7.2 正定矩阵的特征 


正定矩阵有一些有用的和简单的特征. 

7.2.1 定理 Hermite 矩阵是丰正定的，当 ii 仅当它的所有特征值都是非负的•它是 
正定的，当 旦仅当 它的所有特征值都是正的. 

证明： 如果 A 的每个特征值都是正的，则对于任意 非零* r 6 C ” 有 

. x ' Ai = U m DUx = y - Dy = ^ d . y . y , =I 乂 I 2 > 0, 

•-I 丨 

其中， D = diag ( J ,, J 2t A ) 是由 A 的特征值组成的对角矩阵， y ^ Ujr , 且 U 是酉矩阵. 
其逆命矬包含在论断 （7. 1.4), (« 半正定的情形是类 似的. □ 

_ 练习 证明，非奇异矩阵是正定的当且仅当是正 定的. 

练习 设是半正定矩阵.试用 （7.2.1) 证明， A 是正定的，当且仅当 ran kA = w . 
试与 （7. 1>节习题1比较. 

7.2.2 推论 如果 A 6 M ” 是半正定 矩阵， 则对所有 A = 2, …， A * 也是半正定矩阵. 

证明： 如果 A 的特征值是 A ,， …， A *, 则 A * 的特征值是 A { ，…， □ 

7.2.3 推论 如果/ \ = [ a y ]€ R 是 Hermite 矩阵 • 且是严格对角占优的，乂如果对所有 i = l , 
2，…， w 有…>0，则是正定矩阵 • 

证明： 这是定理 （6. 1.10) 的一 部分. 诸条件指出 A 的每个 Gehgorin 阒盘位于开右半平面 
中. 因 Hermite 矩阵的特征值都是实数，所以 A 的诸特征值必须都是正的，因此由定理 
(7. 2.1) 可知 A 是正定矩阵. □ 

练习 如果 Hermite 矩阵 A •相合于具有正对角元的严格对角占优矩阵，证明 A 是正定 
矩阵. 




下面的特征对于通过计算来确定正定性没有多大的实用价值，但是在理论上它可能很 
有用. 

7. 2.4 推论 设 A 是 Hermite 矩阵，乂设 

p A (/) = 十〜， 1 + … + U " _ 

是 A 的特征多 项式. 假定 E 心―关 0. 则 A 是半正定矩阵，当钍仅 当〜关 0对所有 
成立且“ •丨 <0 对々 = w _/ w ， …，”一 1 成立. 我们规定 
证明： 论断只是要求，前面的诸系数心是非零的，且它们的符号是严格交错的.如果这 
个条件被满足，就不可能有任何负的 零点； 因此 A 的所有特征值必须是非负的.反过 
来，如果 A 是半止定矩阵，它的正特征值记作 A ,, A 2 ， …，(其余《 — 个特征值都是 零〉. 

用归纳法可以证明，各个多项式 （/ 一 A ,>, (/ U (卜 A!>, …, (/—AJG — A 2 ) …（，一的诸 
系数都是非零的，且它们的符号是交错的.乘以 /• _便得 / m (/). □ 

为了使 T 面的特征更容易被接受，用 A , 表示由 A 前 i 行和前/列确定的 A 的前主子矩阵，_ 
A,=A({\, 2, i }), / = 2,…， a 我们已经知道，如果 A 是正定 矩阵， 则 A 的所有主+ 

式都是正数，事实上，当 A 是 Hermite 矩阵时，逆命题 成立. 但是可以得出一个更强的结论. 

需要指出 的是， 如果 A 是 Hermite 矩阵，则每个 A , 也是 Hermite 矩阵，因此每个 A , 有实行 
列式. 

7.2.5 定理 如果 A 6 M ” 是 Hermite 矩阵，则 A 是正定矩阵 • 当 fi 仅当 det 〉0对, = 1， 

2,…，《 成立. 更一般地， A 的”个主子式（不一定是诸前主子式>所组成的任—套序列的正 
性是 A 为正定矩阵的必要充分条件. 

证明： 由 （7.1.5) 可知，只要 A 是正定矩阵 ， det A ,>0 就对所有》= 1, 2，…，《都成立. 

我们用归纳法和 Hermite 矩阵的交错不等式组 （4.3.8) 来证明其逆命题，因为 detAX )， 且 
A , 是 1 X 1 阶的，所以 A , 是正定 矩阵. 如果对某个 A * 是正定矩阵，则 A * 的所冇特征 
值都是正数，因而由交错不等式组可知，或许除了 的最小特征值以外， A * fl 的所有特征 

值都是 正的. 但是 A +, 的各特征值之积正好是根据假定，它是正数，因此泉+,不 
可能有负特征值.由此 可知. A *, ,的 ft 小特征值也是正数，因而 A * M 必须是正定矩阵.因为 
人=々，所以 A 是正定矩阵.对于一般套序列情形 • 只要考虑 .4 的各行和各列的适当置换就 • 

可以了. □ 

定理 （7.2.5) 说明，当（且 仅当） Hermite 的各前主子式是正数的时候，它就是正定 矩阵. 

再想到 （7.2. 1>,于 是为了 验证正定性，可以检验与 A 相关的这两组数中的任何 一组. 

练习 试用 （7.2.5) 证明矩阵 

5-1 3_ 

A = - 1 2-2 

- 3 -2 3. 

是正定的. 

练习 证明对称矩阵 = 的各前主子式是非负的，但它不是半正 定的. 
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练习设 是 Hermite 矩阵，乂假定 detA ,>0, detA 2 >0, …， detA ^ X ), 且 

det A .>0. 证明 A 是半正定矩阵. 提示： 如果将丄的诸特征值与 A ,-, 的诸特征值比较，交 
_ 错不等式指的是什么？ 

练习假定 Hermite 矩阵有全部正对角元和正行列式，考察矩阵 

1 2 r 

2 11 , 

-1 1 t _ 

对适当的/值 ilE 明，仅有上述假定还不能确定 A 的正定性.证明，若另有某个 （〃一 l ) X(/z — 1) 
主子矩阵是对角占优的，则这个假定条件是充分的. 

练习设 R 是 Hermitc 矩阵，证明 • A 是半正定矩阵，当 R 仅当存在一系列 
Hermite 矩 阵八， 使得与 e -0 时 /\， fl A , 的每个主子矩阵有正行列式.由此得出，如果 
/\的所有主子式都是非负的，则 A 是 f •正定矩阵. 

对所冇4=1, 2,…，每个正实数 有唯一 的正的 A 次方根.类似的结果对正定矩阵也 
成立. 

7. 2.6 定理设是半正定矩阵，且々>1是给定的幣数，则存在唯一的半正定 Hermite 
矩阵 B 使得 /V = A . N 时还冇 

( a ) BA^ABi 

( b ) rank Zi = rank A , 因而，只要 A 是正定矩阵，《就是正定矩阵； 

( c ) 如果 A 足实矩阵，则 S 也是实矩阵. 

证明： 我们知迫 Hermite 矩阵 A hf 两对角化成,其中 A = diagU , ,…， ) 且 
所有 l >0. 定义其中 A ,/4 = diag ( A |*, Ai *), 且每个 A , 都取唯一的 ife 次非 

负根. 44然， B*=A 且 /i 是 半正定 Hermite 矩阵. 此外 • AB = UAU 9 VA l / k U ' = UAA l /> U f = 
UA l > AU ' = UA l > U'UAW = HA . 乂 W 为所有 >1 •(因 ifti 它们的 A 次方根）都是非负的，所以 B 
是半正定矩阵. B 的秩正好是非零彳，项的个数，它也是 A 的秩. 如果 A 是苹正定实矩阵，则 
我们知道 C ； 可以选为实正交矩阵， W 而在这种悄形 B W 然 Pi 以选为实矩阵.余下要考虑的只 
是唯一性问题. 

首先要指出的是，存4:多项式/>(/〉，使得 〆 = 为了得到 p ( A >= A "*, 从而得到 
/>( A > = paMLT 二以 1 W =13,我们只需选取 p ⑺为适合数组 （ Al , A "*)， …， 

U ”， A :/*) 的 Lagrange 插值多项式 （0.9. 11). 另一方面，如果 C 是使得 C * = A 的任一半正定 
Li 0 r 3 Hermite 矩阵，则有 /j =/>( A > = 〆 (：*> • 因而 CB =(>( C *) = p ( C * ) C = BC . 因为 B 和 C 是可 
交换的矩阵，它们可以 M 时西对角化：即存仵某个西矩阵 V 和具有非负对角元的对 
角矩阵山和 A 2 ， 使得8 = ^,7•和 C = VA 2 V ' 于是从 = 的事实可以推出 

乂因为非负数的非负々次方根是唯一•的，闪而得出， (^) , *=^ 1 = A 3 = ( A ；) , S 因而 Z 3 = C . 

□ 

上述定理最有用的情形是 k = 2 的 情形. IF •定（半正定>矩阵 A 的唯一正定 （ f 正定） 平方根 
通常记作 A 1 ' 2 . 类似地，对每个（=1，2， …， 表示 A 的唯一正定（半正定）々次 方根. 
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练习确定 P • 

L 3 2 J 

练习如果 A 是正定矩阵，证明 （ A l/2 > '=(A *) ,/2 . 

7. 2.7 定理矩阵是正定矩阵，当且仅当存在非夺异矩阵 A 九使得 B — (〕•（；*. 

证明： 如果 B 可以这样表示，则根据 （7.1. 6>, B 是正定矩阵.为了证明可以得到所要求 
的分解，只要设 C = ii 12 ， 甚至还可以取 r 为 Hermite 矩阵. □ 

7.2.8 推论 Hcrmite 矩阵 A 是正定矩奸，当且仅当它•相合于单位矩阵. 

证明： 这只是 S : 述 （7.2.7). □ 

练习如果是正定矩阵，乂如果 a = c 7 c , HA = ac >. 其中 G ， c \ eM H9 证明 
其中 V 是丙矩阵.特別地，证明 A ^ CTC ： 的任何解(：具有形式 C = VA 12 , 其中 V 
是两矩阵. 提示： 证明 

• A l , 2 C'CA 1/2 = ((W (CA l 2 ) = / 

能够明确指出卡正定矩阵 .4 的分解 •(二 这存时是很有 用的. 每个方阵 C 冇 (?/? 分解 
(2.6.1)，丨 ICIf 写成 () = QR ， 其中， Q 是酉 矩阵. rfli 尺是与 A 有相间秩的上三角矩阵.另一 
方曲 ， A = C ”0=( y/<rQK = ^.QQK = iTK . 如采 C 北奇异，则可以选择尺使得它的所有 
对角元都 Ah 下数（艾际上， 存仵 这种形式的唯-分解 r = QK ), 乂如果 C ’ 为实轵阵，则 Q 和尺 
均可取为实矩 阵. 这就证明 f 下述推论，它给出了 .4 的 rholesky 分解. 

7. 2.9 推论矩阵 A 足正定的，当 1 L 仅当存仵 H 有正对角元的佧奇异下〒角轵阵使得 
A = /」-••如果 A 是实矩阵，则 L 可以取为实矩阵. 

设 A ， …，％是内枳空间 V 中々个给定的向 M 组成的集合，乂设〈 • ，•>是7上给定的 
内积.向域组 的，…， V * 关于 内积<•， • >的 Gram 矩阵是用 A =<%，定义的矩阵 （；= 
半正定矩阵的 ft 后一个特征是 • 它们总 M Gram 矩阵 （7.2. m . 

7.2.10 定理设是向 岵组 { u ，, ，…. uOCIC ■又于给定的内积< • , •> 的 Gram 矩阵， 
乂设 •则 

( a ) G 是半 iF 定矩阵: 

<»^ ( )是作奇异矩阵，当 Ji 仅当 向楗组 斯，…， u ，， 是无关的： 

( c ) 存在正定矩阵使得 G = 

( d ) rank G=rank VV = 向域组 { u ，,，•••• u ，*} 中极大无关组的向 M 个数. 

证明： 如果 G = 且心 =<ttv iv , ) 9 于 是因为 内积有 Hermite 性质，所以 G ’ 是 

Hermiu 、 矩阵，且 

* * * 

= 2 < w v ，於,〉* 2 * 〆 / = S < - r / u， / 

= 〈 〉 = 1 I > 。’ 

其屮 iM 是由已给内枳诱导的范数.根据范数的正定性，只有当 
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X - r * u， * = 0 

i-l 

时等式才成立，而且只有当给定的向 M 组相关时， t 式才对非平凡系数组 A 成立.如果 G 是 
竒异矩阵，则存在某个非零向 tta •使得 Gj =0， 因而，（^ = 0,这推出向量组叫是相关的. 
反过来，如果心叫+… + j ** i ^=0， 且1 =[心]关0,则我们已经证明 ， G*r = 0， 因而 G — 定 
_ 是奇异矩阵. 

如果 U ,， …，是 C ” 的标准正交基，则根据 （ a > 和 （ b )，A = (( e )9 是正定矩阵.对 
任意向 M * r ， y 6 C ” 有 

〈• v ，* r > =〈 2从，2",〉= 2〈 e 〆 ,〉*^ = J -' Ay 9 
' >"l »»1 / •.>-! 

于是有 A = < i ^， u \> = ur ,' Aw , , 因而 G = WAVV . 

M 后，如果 CAr =0， 则 VV AW ^ = ( W^rr A ( Wi )=0, W 为 A 是正 定矩阵，这 

就殖涵 VKr =0. 反之，頌涵 A ( H ^ r ) = 0, 于是 A 与 W 有相同的零空间，因而 

有相同的秩. W 的列秩是向«组{斯，…，抑丨中极人无关组的向贵个数. □ 

练习定理敁常阽的应用是针对所给内积为普通 Euclid 内积 W = 的情形的.证 

明，在这种情形， a =/， 并 a 证明给定的向》组 { u ，,，“•• it ^ cc ■中极大无关组的向 ft 个数 

恰好是矩阵 （）= [>,• 的秩. 
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7.2.11 推论设 A 6 iVt 是绐定的 矩阵. 则 A 是秩为 r < W 的半正定矩阵，当且仅当存在恰好 
含冇 r 个无关向 M 的向 M 组 •••• w „} CIC \ 使得 A fiS 关于 Eucldi 内积的 Gram 
矩阵. 


证明： 充分性部分在上述定理中已冇 论述. 至于必要性，可以利用（7.2.6> 把 A 写成 A = 
H 2 , 是 f •正定 矩阵. 《的秩与 A 的秩相同 ， tIA = tf = iTB 是 B 的各列 ftEuclid 内积下的 
Gram 矩砰. □ 

习题 


1. 证明，如果 A 是 Hermite 矩阵，则对所冇1, 2,…， A 2 * 是半正定矩阵，而 〆 是正 
定 矩阵. 参看 （5.6. 15> 下面的练习. 

2. 如果/\是半正定矩阵，又如果 〆 />是使 〆 M 〉0 时对所有/>0都成立的任一多项式， 
证明 / KA ) 是 f •正定 矩阵.提示： p ( A ) 的诸特征值是什么？这是如何推广了4题 l ? 

3. 试用 （7.2.5) 证明，用、 )) 定义的矩阵 A = [> v ]e 是正定 矩阵. 提 示：计 
算 detA ,; 从所有其余行中减去第丨行，然后对第丨列也这样做， a 0 = max { i f 说明什么？ 


4. 如果 A 和 B 是正定矩阵，证明直和 


•A 
• 0 


也是正定矩阵. 


5. 给出一个（非 Hermite ) 实方阵的例子 • 它的各前主子式都是正数，但使某个特征值有负 
实部. 


6. 试给出 （7.2.5) 中一般不等式组的详细证明.即证明，71个主子式（不一定是诸前主子 
式，按包含关系）所构成的任一套序列的正性是 Hermite 矩阵为正定矩阵的充分条件. 
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7. 如果用 A 的诸子式的符号来表示， A 是负定（半负定）的必要充分条件是什么？ 

8. 半正定矩阵 A 有不同于 A 1 ' 2 的“平方根”吗？有多少？有不同于 A 1/2 的々次方根吗？有 

非 Hermite 平方根吗？ 提示： 考察 [ :|] . 

9. 如果是半正定矩阵，且有秩证明，存在秩为 m 的 mX ” 矩阵 C , 使得 B = 

C - C . 特別要指出的是，秩为1的十正定矩阵总可以写成形式 X ，，其中 ^6(：” 为某个向 M . 

10. 假定 A 6 M * 是半正定矩阵，且有秩 r < W . 证明 A 有 rXr 阶正定主子矩阵. 

11. 设是 Hermite 矩阵 • 证明， A 是正定矩阵，当且仅当经典伴随 adj A 是正定矩 
阵 FLdetA >0. 如果 A 是半正定矩阵 • 证明 ， adj A 是半正定矩阵 R det A >0. 提示： 考察 

£>0. 试考察 Aedi a g (0, 0，一 1> 来说明，如果 A 不是半正定矩阵，也可能 acij 
A 是半正定矩阵且 det A ^ O . 

12. 已知 re (0.1>, 考虑由 u 定义的实对称 ToeplUz 矩阵 A = [^] eAC 试如下 
证明/ V 是正定 矩阵： （ a ) 如果 A „ 是 A 的/, ) 子式 • 证明，只要 | / —) 丨 >2就有 det A ,>=0. 

提示： 如果则可以矜出 A ,, 的第1列是第2列的倍数. （ b > 设 D „ = d C tA . 证明 
f ) 2 = l ~ V ， 然后将按第1行的余子式 展汗， 且利用 （ a ) 证明 D ^= D ，—^仏=(]一 r ^ D ,, 

=(1 一 〆 ）”• ( c ) 利用 (7. 2. 5) 推出 A 是正定矩阵. 

13. 证明习题12中的矩阵 A 冇一个实对称三对角》阵为其逆， 冉证 明， U — r ^/ T 1 在上 
对角线和下对角线的每个位 S 上有元家一 r , 且它冇主对角元丨， 1+ r 2 , …， 1+ r . i . 提示： 

利用习题 12( a ) 证明/\，是—对角 矩阵. 为什么 A 1 —定是对称矩阵？然后利用 [409] 
=/确定的各元索. 

14. 设<•， • >是 CT 上给定的内积，设 Xn , …，是 C ■(关 于普通的 Euclid 内积）的标 
准正交基，乂设 G 6 M ,. 表示3关于所给内积< • ， OWGram 矩阵.证明，对所有 《 r , . v € C " 有 

< jr . y > = y ' Gx . (7.2.12) 

由此可得，函数〈 • ， • >: C " XC "— C 是 内积， 当且仅当存在正定矩阵 G 使得 （7.2. 12) 成立 • 

15. 回忆一下在 （5. 4 . 12) 中定义的对 偶范數 槪念. 设 <•, .彡是。”上给定的内积， &设 
II • II 是 C " 上给定的范数.所给范数不一定是由所给内积 i 秀导的.我们可以定义 HI 关于内积 
〈 • ， • >的对偶范數为 



注意，如果〈 • ， • >是普通的 Euclid 内积，则它就是 Ml 的普通的对偶范数.对偶范数槪念 
的这种推广可以产生用其他方法尚未得到过的向 M 范数吗？ 提示： 利用习题14,记 〈 t ，； y > = 
y ' Gx , 然后证明 

iuii?...>= II G-^r=( ii x || )° 

16 •设是给定的矩阵，证明， 〆 A ><1, 当且仅当存在正定矩阵 BeAt 使得 B — 
A'i3A 是正定矩阵. 提示： 如果 B 是正定矩阵，设0=好 /2 .如果 

B — A. BA = C. C— (CAV (CA) 

是正定矩阵，则对任何非零有 
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x -[ C * C -( CA )* ( CA )>> 0, 

或 || Cr || 2 > || C'Ar || 2 . 设: y = Cr , 证明对所有非零: C ” 有 || ：y || 2 > || CACT ^ || 2 ， 由此得出 
'll CAC '! b < l . 因此 〆 l )< CAC X %< 1 . 反过來， 如果 〆 A )<1， 则存在非奇 
异矩阵使得 〖CAC liCl [见（5.6>节习题 25], 并 R 上述证明可以反推回去，冉令三 

17. 设/■是半正定矩阵，且不都是奇异矩阵.证明 

+A m . n (B>1. 提示： 设 E=A — B . 设 i€C” 是使且 Ul = / >(f ； )=i||i*；| 的单位向 tt . 
于是， A 2 -B 2 =AK-^EA-E 2 , 并 ftl| A 2 - B 2 \ x' (AE^EA-E 2 )^ | = | A I Ar + 
画， Bx)> I A I (A_(A)+A m . n (B)>. 

18. 设 A . BeAl 是半正定矩阵，且假定/\是正定矩阵.利用习题17证明 

<| t .4 ' MUiA-Bl (7.2.13) 

并 a 说明为什么这个不等式组涵以下 亊实： 定义仵由 m w 中的半正定矩阵所组成的集合上的函 
数/: r — c 12 在这个集合的内部（它是由正定矩阵组成的 开集） 连续.写出并打接证明关于[0, 
上的普通纯 tt 的平方根函数/: /- V 7 的不等式，这个不等式是从 （7.2. 13) 中令 W = 1 得 
来的. 


7.3 极形式和奇异值分解 


下面，论述（不一定足方 阵的） a 矩阵的两种相关的 s 要分解，它们与正定性槪念有密切 
关系. 

7.3 •丨引理设奶<«， tlrank A = 则存在两矩阵 X € M ,,、 具有: JH 负对角元 

-夂=0的对角矩阵以及具有标准正交行的使得 
A ^ XAY . 矩阵 3 = 叩 ( A,， … • 总是唯一确定的， RU ?，•••• 么>是•的诸特征值. 
矩阵 X的各列是 A/V 的特征向 tt. 如果 AA •有互不相同的特征值， 那么， X可确定到相差一 
个右对角… • 〆 ■〉，其中所有也就是说，如果•则 
Xd[). 给定X后，如果 nmkA = 7/i , 则矩阵 Y 是唯一确定的.如果 A 是实矩阵，则X和 
y 可以取实矩阵. 

证明： 如果是所要求的分解形式，则 A 4. = XAVyA；T = XA / A：r = XA L > X . ， 
因而是 Hermite 矩晬 AA •的西对角化.若 X - Cmn 爾] 且 W = diag ( A ?， …， Al ), 
则/）= 1，2•…，所， R 向 M 组 U ,} 是标准正交组.因为 A 的渚对角元是非负 
的.且按递减顺序排列，所以 A 由 AA •唯一 确定. 如果数组是互不相同的，那么，除了 
相差一个模为丨的复纯挞《子以外，•的各个相应的正规化特征向 ft 都是确定的，因此，如 
果 X ,和 X 2 是其各列为 AA •的特征向 M 的两个两矩阵 • 则一定有 X 2 = X , D ， 其屮， D^diag 
( t/| ， …， c/ n )f 且所有 14 1=1. 

AA •的相应于重特征值的特征向童不是唯一确定的，但是，它们一经选定，且把它们标准 
正交化，西矩阵 X 就固定下来，如果 A 是非奇异矩阵，也就是当 6 = nmk A = w 的时候，则 y 
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= A A 是唯一确 定的. 我们不椎验证 ， yy =A ' X - (AA X)A l =A ! X * XA 3 i \ '= _ 

A l A 2 A- l = L 因此，这个矩阵 Y 有标准正交行. 

余下只 要讨论 rank A = A < m 的情形.因为当所有 A , #0时，我们希望有 Y = A — X' A = 
A -'( A - X )- ,这促使我们定义 Y 的第）行是行向量: y / ， 其中： ）= 1, …，々. 

于是 

[ A / 1 ( A ' x , )] * [ XI 1 ( A ' j * )] = x ,' AA a : r kl X,Xk = x ,' Xix k / X , X k = xj x k X k / X , 

如果它就是零，如果它就是 1, 这是因为向 W 组 U , l 是标准正交组.向 M 组{%, 

…，是 C " 中的标准£交组，且；因此另外有// I 一々个（俏不是唯一确定的）标准正 
交向世力》丨，…，^，使得矩阵 Y • e [. vi . v 2 …: vo ^ t , …>»„」6从.》有 w 个标准正交列. 

现在 证明 ； TA = AK 根据向 W 乂的定义，这个恒等式两边的前々行是相等的. 因为 A 
的 M 后⑺一々个对角元足零，所以右边最后行都是零：左边最后 m - A 行也都是零，这 
是因为，如果 AA \ r ,=0， n 0= jr ； AAxj = ( Ax,) u ( Ax > )=0, 因而心,=0. 

最后 • 如果/ V 是实矩阵，则 A / V 也是实轵阵且冇实特征值，因而，特征向財组； C 可以取 
为实向 S 组.根据定义，由 X 确定的 y 的前 A 个行都是实的，添加的 m —々个正交单位向嫩可 
以取实的.《此，如果 A 是实矩阵.它的所有 W 子都可以取实矩阵. □ 

每个非零复数）有唯一的“极*示其中 /) 是正实数，而“是模为1的 g 数. 实际 
上，如果 Z 关0,则/>=丨 H 且 u^p l z = z / I 2 I . 如果 z = 0. 则 z 仍然可以写成 /) = 0 的极 
形式，不过“不再是唯一确 定的. 当然，《可以取模为1的任意复数. 

如何把这种极表示推广到复矩阵呢？ 种间答是 A = 其中， P 是正定（半正 
定）矩阵，而 L / 是两 矩阵. 甚至还可以把它推广到 A 不是方阵的情形. 

7. 3.2 定理设 A 6 A ^. m ， 且则/\可以写成 

A = PU . 

其中，是半正定矩阵 • rank P = rank A , 而以 6 AC •有标准正交行（即1/【厂= /)• 矩阵 
P 总可以唯一确定为 P = ( AA _ >〃 2 ,而当 A 有秩 m 时， L ； 是唯一确定的.如果/\是实矩阵， 

则 P 和【/可以取实矩阵. _ 

证明：利用 （7.3.1) 把 a 写成 A = ； o \ y =;^: v . XV ，且令和 i /= xy . 于是 P 
足半正定矩阵，且 c / i /.=; cyy ; r =; c /; r =. Y ： v .=/, 因而(7有标准正交行.根据 （7.3.1) 

中的构造法， P^(AA ) ,/2 , 一般说来，如果 A = P 以，贝 Ij 九 /V = PL/LT f > = P 2 ， 所以一定 
总是•的（唯一）半正定 方根. 如果 A 有秩 w ， 则 P 非奇异，而是唯一确定的. 

似是，正如在 （7. 3. 1>中希到的，如果 rankAOi ， 则 Y 的相应于尸的0特征值的各行不是唯 
一确定的，因此，当 rankACw 时， U = 未必是唯一确 定的. □ 

本定理直接推出下述 * 要的特殊情形. 

7. 3.3 推论如果 A 6 At , 则它可以写成形式 

A = PU , 

其中， P 是半正定矩阵，1/是酉 矩阵. 矩阵 P 总可以唯一确定为尸三（九 A * > 1/2 : 如果 A 是非 
奇异 矩阵， 则【/可以 唯一确 定为如果 A 是实矩阵，则 P 和可以取实 矩阵. 
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练习说明定理 （7.3.2) 可以用下述极限证法来证明.如果 A 是非奇异矩阵，则令 P = 
(A A * ) ,/2 ,定义 L / eP ' A , 且验证因此，尸和 L / 都是唯一确 定的. 如果 A 是奇异 
矩阵，考虑 A,eA + e /， 以及形式 = 其中两个因子都是唯一确定的.利用选择原理 

(2. 1.8) 得到序列(当 々- oo 时）， 使得当 A — oo 时， L ；~ 按对应元收敛于两矩阵 L 7. 因为 
P , t = A , U； k ,我们还有 P , t - P*A = Pl ；， 值得指出的是，从理论上讲，这个证明虽然比前面 
对 （7. 3. 2) 所做的证明更简略，佝是当 A 是奇异矩阵时，它并没有给出得到因子尸和 L ； 的构造 
性方法. 

分解 （7.3.2) 称为矩阵 A 的极形式或极 分解.当 A 满秩时，两个因子还是唯一的. 

练习如果 AeM _， 证明它可以写成 
* A = WQ 9 

其中，有标准正交列（即 W 而是半正定矩阵 • 提示： 利用 （7.3.2) 分 

解/ 

练习设 I 6 C •是给定的非零向*, M . A = x 6 M ..,. 证明 A 的极分解是 A =* r = 

_ 其屮 u ^ x ! || ^ || 2 . 故极分解可 以吞作 作零向 M 的简便分解 || t \\ 2 ( j -/ || ^ || 2 )到矩阵的 
推广. 

练习证明，方阵 A 既 CJ 写成/ \ = 也可写成 A 二 WQ , 其中 ， P = ( AA - ) ,/2 ,而（3 = 

( A - A ) l /2 . 有时称它们为/\的“左”和“冇”极分解.证明，唯一确定的半正定因子户和(3相等， 
当 M 仅当 A 是正规矩阵.实际上 • 如果 A 是非奇异矩阵，则唯一确定的两因子 U 和 W 恒相等 
[定理 （7. 3. 6) 前的练习]. 

练习不是每个方阵都是正 规的； 即 .4 V => VA 未必 成立. 但是 AA •总西相似于 AV \. 试 
用极分解 （7. 3. 3) 证明这一负实 . 

7.3.4 定理设 AeM „， 乂设/\ = PL ； 是极 分解. 则 A 是正规矩阵，当 a 仅当 

证明：如果 P 和 1/可交换， W ] AA ' = PL / L 7 # P * = PP = P 2 , A'A = U a P 9 PU = U ' P 2 (J = 
U ' UP 2 = P 2 , 因而 A 是正规 矩阵. 如果 A 是正规矩阵，则 P 2 = trP 2 L 7. 我们知道，户和 
【广都是中•正定 方阵. MS 然冇相成的辛正定平方根 P 和 [；• Pa 但是定理 （7. 2. 6) 说明， 
这样的平方根是唯一的，因而 P=ir PI ； 或 C/P = PL /. n 

我们的下一个 B 标是，从 （7. 3. 1) 得出（不一定是方阵的）任意矩阵的奇异值 分解. 

7- 3.5 定理如果冇秩则它可以写成形式 

A = V 2 W - , 

其中 V 6 风”和 是两 矩阵. 矩阵对所有, •关） 有〜 = 0 ,且 〜彡如彡… 
〉 a *4 丨.… =-••=〜 =0，其中 g «= min { w , ”}• 数三 U 丨是 AA •的特征值的非负平方 
根， W 而被唯一确定. V 的各列是•的特征向 M , 研的各列是 / TA 的特征向量（它们的排列 
顺序与相应的特征值 i 的排列顺序相同〉.如果",旦 AA •有互不相同的特征值，则 V 可 
以确定到相差一个右对角因 + D = diag ( 〆 ， ， •••• 〆 ■)， 其中所有也就是 • 如果/ \ = 

，则 V 2 = V , D . 如果讲<打，则 W —定不是唯一确 定的： 如果 n = m ，且 V 
已经给定，那么 w 是唯一确定的.如果则 v 和 w 的唯一性要根据 a •来确定.如果 a 
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是实矩阵，则 V ，2和 W 都可以取实矩阵. 

证明： 不失一般性，假定//!</!<否则用 A •代替 A ). 利用（7.3.1)可把4写成八=；^>% 

其中， x , A 6 M ,., 且 yeM ,,.,. 令 vex , 取且定义 w ^ cyisqe ^ 

使得 vv 的各列是 c ” 中的标准正交组. y •的各列已是标准正交组，所以，如果，〃<〃，可选取 

eM H . tn «，的各列（但不唯一 》 使州为酉 矩阵. 这 fi 接推出 V 2 W 关于唯一性的 

论断可以从 （7.3. 1) 中的相应论断得出. □ 

对 i = l ， …， q = m \ n { m , w }, 2的“对角元” tr , = a •称为 A 6 的奇异值（有时只对非零 
对角元才这样称呼 >，而 V 的列和 W 的列是 A 的（相应左 和右〉 奇异 向量. 分解 （7.3.5) 称为 A 
的奇异值 分解. 极矩阵 PM A /\ •的唯一半正定平方根，而奇异值 a , 是 AA •的特征值的非负平 
方根，所以 A 的奇异值与极矩阵 P 的特征值 相同. 虽然奇异值按递减顺序排列是方便的，但 
这并不是奇异值分解中的一般 规定； 它只是由 A 唯一确定的一组奇异值. 

应该指出，奇异值分解是正规矩阵的两对角化到任意矩阵的自然 推广. 由于这个理由，常 
常有这种 悄形， 关于正规矩阵的特征值的一些结果可以推广成关于一般矩阵的奇异值的一些 
结论. 

练习设 leer 是给定的非零向块，证明 • A 的奇异值分解是々=| = 
f 其中， W = [1]6M,, 2=[ || ^-|| 2 , 0, 0] t 6M m .,, 而 V = [ t ；,， …， vJeM ” 有 

v ^ j / II J -|| 2 , 且巧，…，％是与 *r 正交的任意 n — 1个单位正交向 M . 

如果 A 6 M ”， 则奇异值分解中的三个 W 子 V ，2和 W 都是 nX / i 矩阵. 如果/ \ = 是 A 
的极分解，乂如果 P = •是 P 的西对角化，其中 P 的（一定非负）诸特征值按递减顺序排 
列， 则々 = •是 A 的奇异值分解，其中 V _ V , 2 =八， 

且\^ = ^注意到 AA ，= V ^ WVV 2 V = V ^ V ， W 而 V 的诸列是 Hermite 矩阵 AA * 的相 
应于特征值 X ，…， d 的特征向 M . 另外 ， AA = WIV VIW a = WZ 2 W ,因而 W 的诸列是_ 
AVA 的特征向 ft . 

练习如果是非奇异矩阵，证明下述步骤给出奇异值分解 A = V 2 W •: 

(a) 作出正定 Hermite 矩阵 AA _ ，然后通过求 AA •的各（正）特征值 UJ 以及相应的正规化 
特征向 M 组 A 算出两对角化 AA * ^ UAU \ 

( b ) 令 2= A I/2 和 V = C 7 = [ W| … tt ,]. 

( c ) 令 W^AVZ 

证明 W 是酉矩阵且/ \= V 2 W . 提示： 计算 WW . 

练习设 AeiW ” 是给定的（不一定非 奇异） 矩阵，证明下述步骤给出奇异值分解 A 
^ VIW ' : 

( a ) 存在某个 CSKA)〉。， 使得对所有正 e<r, A,=A+e / 是非奇异矩阵 • 设 0< e < t .. 

( b ) 利用上一个练习中的方法作奇异值分解 A t = V t I , W ；. 

( c ) 利用选择原理 （2. 1. 8) 且设 £-0, 通过值的序列使得 

lim V ： = V 和 lim W , =W 

«*.•*> t t »0 * 


都存在. 




(cU 证明 A = • 其中 2 = 

€ 

这个可以用来证明一般的奇异值分解 （7.3.5> 的证法保证存在一个奇异值分解，但是，当 
不是满秩的时候，它一般没有给出计算舒异值分解中的各个因子的构造性方法. 

练习假定是非奇异矩阵，& A = A = 是 A 的左和右极分解，其中 
Q 6 M n 是正定矩阵， L ；， W 6 M „ 是丙 矩阵. 证明恒有 = 但是 ， P = Q 当且仅当 A 是正 
规矩阵.如果 A 是奇异矩阵，证明存在 A 的左和右的极分解使关 W . 提示： 如果 A = 
V 2 VV •是 A 的介异伉分解，则 V 或 W 都不是唯一确定的，但是 ， A = ( VW - )(WIW )= 
(VIV )( VV ^* )： 采用 （7.3.3) 的唯一性部分.考察4 = 0，说明，如果/\是奇异矩阵，则 A 
QH 的两个极分解中的 WW ? 不一定相 N . 

如果是正规 矩阵， 且 A = •是奇异值 分解， 则 AA =/ VA , W 而 AA •和 AV \ 

有相 M 的特征向 W . 但是，由此不能推出，在 .4 的奇异值分解中有 V = 因为 V = VV 时， 
就一定是（甚至是半正定 > H crm i te 矩阵. 如果 A =【 ML ； •是 A 的两对角化 ， M A = 
diag ( A , A „). 则毎个幻= U * I〆 *对某个 A € R 成立:如果 A =0, 选 ft =0. 如果令 Ctediag 
( 〆，•"，，）和 U I = diag ( u I , …， I A . I ) ，则 A = I A I /), RA ^ IJAU - =U \ A \ DV ^ 
a /)( I a I m ； rn •三 vsw •是 a 的奇异倌分解 • 其中， v = i ;, 2 = l a l , a w = ud . 

W 此， jh 规矩阵的奇异 ffi 正好是其特征俏的绝对值， v 的各列是 a 的特征向嬌， w 的各 
列视为与 v 的各列相同 • 只是每-列都乘以一个由相应的特征值确定的绝对值为1的 j {纯 
如果 A 是 HermUe 矩阵，则所有特征值都是实的 , /)=D R D = diag ( sgn ( X ,) , sgn ( A „)). 

其中令 s g n (0> = l . 如果 A 是正定 Hermite 矩阵，则0=/, V = W = U , Q . A = I . 

SchurH 角化定理 （2.3. 1>的一个夯效应用是，证明 r 毎个 S 方阵珐具有互异特征值的矩 
阵的 极限. 奇异值分解可以用来证明每个 fi 矩阵（方阵或非方阵）是 ft 有互 异奇异值的矩阵的极 
限.这可能 ii •有用的， W 为作奇诗值互不相同的情形，奇异值分解具有不完全的唯 一性. 

7.3.6 推论如果给定的矩阵，乂 Ml 是上的给定的范数，则对每个 e >0, 
存在具有互#奇择值的次€从_使得 || A-AJI < e . 

证明： 假定设/ \ = •是 A 的奇异值分解，乂设 

^3 = [ diag (( y , 4- ^. a ? 4- 25 .•- .< r „ + W : 0] 

K ：, l ' °^ M .. 如果 A 的所有奇•异值都相等，则对所有 A >0 •厶将有互不相同的对角元. 

>(、然的话 • 如果选取 i )'>0 使得小于各个不同奇异值间的锒小的差， 则厶就 有互不相同的 
对角元. A : 这两种情形 • 当& ♦() 时，厶― 2. 如果令三 V&W ， W 为 Frohenius 范数是西 
不变的，所以丐 <5—0 时 ，II A - A , || 2 = 1)2-2, || 2 -0.佴是，上的所有范数都是等价 
4 l 7| 的，因此完成了 证明. 如果 w > w , 证明是类似的. 口 

有一个简单的变换使我们能把 Hermite 矩阵的关于特征值的结果转变成任意矩阵的关于奇 
异值的结果. 

7.3.7 定理 S A 6 M m .n • (/ = min {// i , w }, 并且定义 A 6 „ 为 
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设 仍， •• •，〜 是非负实数.则 A 的奇异值是 a , a 2 , …，％， 当且仅当 A 的 m + w 个特征 
值是 ，02 * …， o q . ~ 0 \ * ―办 • …， 一 q 和丨 m — n \ 个 0. 

证明： 假定且设/ \ = •是 A 的奇异值分解.记 

rsi 

2 = e m ，… o e 

» v/ -■ 

其中 s ^ diagu ,, 心，…，么）， 并且把两 w 子 veM _ 写成 v /=( v ,: v 2 ], 其中 vaMp ， v 2 e 
如果令 V ; 之八尽和 W = W 7 v ^， 则矩阵 


f •為 ▲ 

【/三 r 巧 

lw w 

足两矩阵， II 经貞接计算可以验证 

A = U 


v : e m 〜• o e m ” 一 
o J 

-S 0 0- 
0 _S 0 U ', 

-0 0 0 - 


其中对角零块是 （w —， /)x(w — w > 矩阵.如果 w<w, 证明是类似的. □ 

练习设 AeM w .•是给定的矩阵 • 证明 W 、 A 7 * 和 A 的奇异值与 A 的相 同. 如果 【/eiV^ 
和是两矩阵，证明的夺异俏与 A 的 相同. 如果 r€C , 证明04的舒异值是的奇 


异傖的 U I 倍. 


作为定理 （7.3.7) 的一个迕接应用，我 f 门有关任意轵阵的舒异值的一些扰动结果 • 这些结 
果 M 从 HermiR 、# 阵的相应结果得宋的.它们说明每个矩阵关于奇异值的汁算是优态的•可以_ 
把它们 N (6.3.2>、（6. 3. 4 >以及其中关于条件数的 W 论作一 比较. 关于如何把这些结果推广到 " 
任意两不变范数，可参 ©(7. 4.51〉. 


7.3.8 推论 设 /U H 6 M ,,.,. E=B — A , il 设(/= min{ m, "}• 如果 a …是 A 的 

奇异值， ft 是 B 的奇异值则 

(a> I — r, | < || E || 2 对所有 i = l ，2,…， g 成立； 

( b > [ Su ] l/2 < II ^ iu . 

I 

证明：这两个结果类似于 Weyl 不等式 [(4.3. 也可参看 （6. 3. 5) 前面的练习]以及关于 

Hermite 矩阵的 Hoffmam - Wielandt 定理 （6. 3. 8). 它们可从所述结果及 (7. 3. 7) 直接得出 .口 
练习给出 （7. 3. 8>的详细 证明. 关于 （ a> 见 （5. 6>节习题 36. 

奇异值也有交错性质：它是由 Hermite 矩阵的特征值交错性质得来的. 

7.3.9 定理 设给定的矩阵，乂设 A 是划去 A 的任意一列后得到的 矩阵. 设 表 
示 A 的奇异值， 表示 A 的奇异值，且都按递减顺序排列. 

( a ) 如果，则 

^ R > < J 2 > …> A ，> (7„ > 0. 

( b ) 如果 m < n , BlJ 

A > A > «?z > d 2 > … 〜 ^ ^ 0. 




如果划去 A 的一行，而不是 一列. 则相应的不等式可通过交换 （ a > 和 （ b ) 中的〃 I 和《来得到. 

证明： . A 的奇异值的平方是 Hermiwr 矩阵的特征值，而 A 的奇异值的平方是 
A * AeM , ，的 特征 值； 如果划去 A 的一列， A ‘ A 是 AV \ 的主子矩阵.交错不等式组可从包含 
原理 ㈠ .3. 15>直接得出.如果划去 .4 的一行而不是一列，则相应地考虑 AA •和 AA ' □ 

作为1 Iermite 矩阵的特征值性质与奇异值性质间的最后一个类似，冇与 Courant-Fischer 
定理 （4. 2. 11>类似的定理. 


7.3.10 定理 ^= min {// i . n } 

适合的菜个幣数.则 


设是 A 的有序奇异值，乂设先是 

'V iriir = <,t, 






证明： 这两个公式 《 TA : 接从 H .2.12) 和 U .2. 13> 推出，因为 d ( A > 是 AW 的特征值.如果 
<义 2 <山夂是 Hermite 矩阵 / VA 的有序特征值， 则 〆 （ A ) = A , ( AV \> ,而（4.2.12> 说明 


(JiiA) 


( A * A ) = 


• A . At 


6 C * 


II Ar || 

luf t 




用同样的方法可以证明第二个恒等式. □ 

习题 

1. 设足 t •正定 矩阵. 证明 P 可以写成 P z 的多项式，因此，如采某个矩阵 L ； 与 P 2 
可交换 • 则它一定也与 P 可交换.用这个事实证明.如果是正规矩阵，则它的极因子 
r 和1/可交换. 

2•证明，任意可写成 A = JV " 1 ， 其中 P 是半正定矩阵，而 H 是 
Hermhe 矩阵. 证明 H 可以取为正定矩阵. P 和 H 可由 A 确定到什么程度？ 提示： 如果【/茫 
R 是西 矩阵， = •是 I ；的西对角化，则其中 D 是具有实主对角元的对角矩 

阵. ^ vm " 是什么？ 

3. 证明，•有零奇异值，当旦仅当它有零特征值. 

‘1•设 AC " a g = min {/ w ，《>• 证明 A 的最大奇异值等于 A 的谱范数.证明 A 的 
Frohenius 范数适合佾等式 

»_1 

证明 a ,< l | AlU ^ vi ,， 并且确定使等式成立的 条件. 证明对所有 A 6 Ai n 有 

\\ A Iz < II AlU^^llAl. 


(7. 3. 11) 




考虑 / 和 


"1 0 " 

-0 0」， 


说明 MIU 町以达到这两个界. 


5. 如果且在 A 的奇异值分解 （7.3.5) 中，％是 V 的第々列， w 是 W 的 
第々列.证明 

A ' v k = a t xv k 和 Aw t = a t v k . 

其中心是 A 的第々个奇异值.特别是， WAxr t = m . 

6. 如果给出一个大矩阵/\，如何用数值方法*计算 A 的秩呢？注意到 A 的秩等 fA 的非 
零奇异值的个数，于是，一种从数值上计算 A 的秩的方法是，求奇异值分解，然后取 A 的秩 
为大于某个限定值的奇异值的 个数. 如果 A 的 M 小非岑奇异值与大非芩奇异值之比不接近 
于0,你为什么可以指望用数值方法确定 A 的秩会更容易和更 粞确？ 

7. 设 有奇 异值分解々=^^ ,托定义 > v = w ： rv ^ ,其屮， r 是2的转说，且 
2中 A 的各正奇异值用它们的倒数来代替.证明， 

( a ) 和 /VA 是 Hermite 矩碎； 

(b) AA + A = /\； 

( c ) /\’ AA ，=/\，. 

证明， 如果 A 是非奇异方阵 • 则、矩阵 *4 ♦称为 A 的 Moore Penrose 广义逆. 对于仃 
意矩阵/\， 狂至 于奇异方阵 A 和非方阵 A , 它们都有广义逆. W 证明 • 按上 述要求“）〜 （ c >, 
A f 是唯一确定的. 

«• 线性方程组 Ar =6 的最小二乘解是在使 || Ar - MI 2 为极小的所有向 Mo * 当中,|| ^ || 2 
达到极小值的向 tt * r . 证明 *r = .4 V ; 是 A.r = /, 的 ft 小二乘解. 

•9. 证明 / V = lim / VM / V 十//> •• 其中是习埋7中所定义的矩阵. 

9 

10. 不 ii 接利川特征向《和特征值也可以 导出 夺异值分解 （7.3.5 >• 冋顾一下利用 
Rayleigh - Ritz 原理对角化一个 Hermhe 矩阵的证明 • 从进范败的变分特征可以直接构造出（左 
和右）竒异向撳和奇 异值. 考虑/及变分特征 （** )||.A|^-niax{ !| Ax |U： || u- II，-n. 
(?0 设乂设有特殊形式 

B^\° l U， 'l 

10 X 

K 中 a =!| b 鉴， u；ec - 1 iw xe M n .,. 证明议 •=()• 提示： 如果 <^>0, 考虑（三 ]/(〆 + 

证明 || f ^ ii 2 3 > y + u ，- T 4，， 然后利用 （**>• ⑻设 AeR a 的_|;/\ I :.然后利川 （"> 
证明，存在某个单位向嫩 A 使得 II 九 r , II 2 =〜 设: （ c > 设 W ,, 是两矩阵， 

它们的第1列分别是 A 和>，,•证明 vv AVV , 有谱范数 a , ft 冇 （ a > 中的矩阵形式 • 由此得出 

vr ( d > 通过引人非对角零元组成的列和行汗缩 A , 用公式表示这个归纳过程， 

左乘和右乘相应的两矩阵便可得到 A 的奇异值 分解. （ e > 如果不是 方阵. 情况乂如何？ 

11. 设•是矩阵八6从_的奇异值分解，假定 A 有秩 A ， 且设,丄证 
明说的 最后， i —々列构成 A 的零空间的标准正交基.而 V 的前 A 列构成 A 的值域的标准正 




交基. 

12•设证明 A 和13的零空间的交的标准正交基由 W 的后若千列（有 
多少？）给出，其中是分块矩奸，〜的奇异值分解.提示：对什么时候 
• 4 • 

w | r =0? 你如何求列数相同的 A 个矩阵 A ,， A 2 ，…， A * 的各个零空间的交的标准正交基. 

13. 证明极分解（7.3.2>与奇异值分解在容易相互导出的意义下是等 价的.提示： 把请定 
理应用于 P . 

14. 设 AeM ”. 证明， A 可对角化，当&仅当存在正定 Hermite 矩阵 P 使得尸是正 
规 矩阵.提示： 如果 A = SASM , 应用极分解 （7. 3.3) 于 S . 

15. 试用奇异值分解 （7.3.5) ( 特別是关于分解的唯一性的 论述） 以及推论 （7. 3. 6) 证明， 

Takagi 表示 （4. 4. 4 )对复对称矩阵 成立. 提示: 若有各不相同的奇异值且豸= 
V 2 W 、 则/\ =八 7 =设2\^.另一方面， 存在一 个对角丙矩阵 D = diag (，， ，…， 〆 ">使得 W 
= V 7)， 故 = = 对于一般悄形，把 

(7. 3. 6>和选择原理 （2. 1.8>用于扰动，然后取极限. 

16. 设 A ， q = min { m . wK 设 A 的有序奇异值是〜…彡％ ( A >>0. 类似 
地， 设 B 和 A + B 也南有 序奇异值.设 .5. /K A + fte M … ..是如 <7. 3. 7 a > 中定义的 Hermite 
矩阵.证明 • 对々=丨，2,…， 夂 •_ , n ( A )； R 对 / i 和 （/ H 打）也有类似的结果. 
注意： 诸奇异值楚按递减_序排列的 ， ifij Hermite S ! 阵 A 的诸特 征值是按递增顺片•排列的. 
试用这个等式和 Weyl 定理 （4. 3. 7) 证明 

ct h> < a ,( A ) / 和 i + X r / + 1. 

特別地， + 十仍（川，（为什么这是意料之中 的？〉 （⑴， 

o { ( A )+ a q ( B )). 

17. 考察 a=G ° 0 证明 不等式 + 不是对所有, •= 

1，2都成立，其中 U ,( AM 和 U ( iiH 分別是 A 和 B 的奇异值， fl 都按递降顿序排列. 

18. 设 A ， 是给定的， (/ ; i >. 设 A 的有序奇异值是〜 （為） 〜 （ A ) 
>0，和 A/T eM — 的奇异值也有类似的递减顺序.证明 

>- 1 ( ^ a , ( A )(?, ( ii ) • 1 ^ ^ ^ g + 1. 

这些不等式可以看作类似于习题16中的加法不等式的乘法不等式，当 w = „ 时，它们也 pf 以 
看作谱范数的次乘性质的 推广. 为什么？ 提示： 设 A/T = VVQ 是 AB •的左极分解，其中 ， W 
6 M ,” 是两矩阵，是半正定矩阵.对任一个 』 eC M , Qx ) 2 = ( j -- W ' AB m J ')'= 

[(A* Wx) * (B- !| A- Wx II? || B's ||? = [(W J -)- AA* BB^ ^).设 〜•••，： •一, 

是 AA •的标准正交特征向 撤， 它们对应于 AA •的，•一 1个最大特征值以八），…， a ?_, ( A ), 设 
•v, ，…， 力 -H •的标准正交特征向貴，它们对应于•的 ）一 1 个 ft 大特征值 4(b), …， 
4〆 ⑴，乂设 i 2 =W、 2 , …，义=%，〜■，々，•••• x ^ 
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若对々=1，2,…， /+) — 2, J 都正交于则 ( V ^ KAA -( Wr )< y ( A > IUII ! 和 / B/r 
^;( B ) || x ||^,因此，在这些限制下，我们有 Cir >«( A )<(13) || I 仏于是引用 
Courant-Fischer 定理 （4. 2. 11 ) 便得出 

oU,-^AB- ) = (A^, ^([(AB* )* (.AB- )]' 2 )) 2 

19. 虽然当 .4, S 6 AUt , AB 和 BA 的特征值总是相同的，不过例子 P 门和^ =却 

• VJ \J J Lm \J I — 

说明， AB 和 BA 的奇异值不一定相 问. 但是可以证明和 iT W 的奇异值总是相同的 • 

20. 设久是 W 维随机向《,它的诸分 M 有；平均值和有限方差•设 2 = Cov ( X ) = 

E ( XX ，） [见 （4.5.3.)], 假定 X 是非奇异的，设且 A , BeM ,, 是给定的，随机向 tt 
/ AX 和 BX 冇相同的（零）平均值向 M , 但没有理由指望它们冇相同的协方差 矩阵. 证明， 
Cov ( A；0=(Jov(i3；0 当且仅当 A = iKPL；P 对某个两矩阵 L /6 M , 成立.提示 ： ^ AIA ' = 

B ^ B - , BiJ ( APHAP )- =( BP )( BP )\ 如果 KVV 是 BP 的一个极分解，证明，对某个酉矩阵 
W , Ve RV fi AP 的一个极 分解. 尺是什么？由此得出 A = B ( PW * VP ~ { ) = 
B(PUP L ； 可以确定到什么稈度 9 若2=/ 乂如何？若仏=/乂如何？ 

21. 考虑由 

0 1 0 

A, = ： •• •• , £ >0 

0 ••• 1 

e 0 — 0 

给出的矩阵证明 A , 的特征多项式是 r e . 提 示：用 沿其第1列的 Laplace 代数余子 
式展开汁算 det (// — . Ae ). 证明 A , 的各特 征值足 •&的 w 个 选择.证明 A , 的各奇异值是1 ( r ; 一 1 
亟）和 e . 现在设 / i = l (), 6 = 10 , M . 注意到扰动凡―八引起的各特征值一个 0.1 扰动 ， ftl 
只引起九的仟一奇异值一个】0 +的扰动.人的谘条件数是什么？这是关 f 定理 （7.3. 7>下面_ 
的论断的一个例子，该论断是说，每个矩阵关于奇异值的计箅是良态的，而一个给定矩阵关于 
特征值的计算坷能是病态的. 

22. 设是绐定的.证明，若 A 冇“小”行或列，则 A —定有“小”奇异值•说 

得更明确些，设 A = [ r , r : •…其中 r ,6( T ， 11彳是犬的第/行.用递增顺序排列各行的 

Euclid 范数< IU II 2 : 1 = 1，…，幻,并且用見<沁<〜<艮表示所得到的有序值.证明 

* * 

.. I ^ ^^ = 1 .2 •…， "* 

1 卜 I 

一个类似的上界可用列范数表示.注意诸奇异偵是取顒序 提示： 平方奇异 
值是 Hermite 矩阵 A / V 的特 征值. A / V 的各主对角元是什么？用优化和定理 （4. 3. 26). 关于 
列和不等式考虑 AV \. 与 （4.3) 节习题19比较. 

23. 有一个与奇异值分解类似的 A 然分解 • 其中的丙 因子用 复正交 W 子来代替.佴是，与 
夺异值分解不同的是，这个分解不是总能实 现的： 从（2.3>节习题7可以想到，类似于 Schur 
丙上三角分解的正交分解也不是总能实现的.如果 AeMu 可以写成焱=尸4(^的形式，其中 
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P 6 M W 和是复正交矩阵，而4 = 0,,]€^ < . (1 是在1»时有 A v =0 的意义下的“对角”矩 
阵，证明九 ATGM ,， 是可对角化的且 rank A = nuik AA T . 这两个条件也足以确保所述分解 A 
= PAQ 7 的存在性.如果 A 是实矩阵，这指的是什么？给出一个的例子，说明它不能 
写成 A = / MQ t , 其中 P , (36^^ 2 是复正交矩阵，而是对角矩阵. 

24. 说明奇异值分解为什么可以看作正规矩阵的谱定理的推广. 

25. 关于正规矩阵交换族同时西对角化的定理 （2.5. 5>对于奇异值分解有一个类似的结果. 

设） = M , : 假定存在酉矩阵使得每个 V ^ A , W 是在习题23的 

意义下（即在/关）时其 j 元为 0) 的“对角” 矩阵. 证明， （ a > 每个是正规矩阵，且 

025] (；={ A , A ： : 是一个交换族. （ b > A , A : A * = A * A ; A , 对每个，•， ）， 々6./成 3：. 这 

每一个必要条件也是族7有奇异值分解形式的同时分解的充分条件. 

26. 求两个给定矩阵 A , 的奇异值分解形式的同时分解是前一个习题的一个有意 

思的特殊 情形. 证明，存在西矩阵 WeM , 使得 A = V 2 W •和 B = •(其中 A 

是“对角”矩阵 〉 当 且仅当 Afr 和 fT a 都是正规矩阵. 提示： 为了证明该条件是充分的， 
可证明只要考虑 A — 2是非负矩阵乂是“对角”矩阵的 情形. 若把2：的相同对角元排在一块，证 
明，若 2/ r 和广2’是正规矩阵，则 B 是一个分块对角矩阵，其中 SI 能除了一个子块以外（若 
a m 奇异矩阵）所有 f •块都是正规 矩阵. 对每一个子块，或#用关于正规矩阵的谱定理或者用 
奇异倌分解便可得到结论. 

27. 如果我们 希望有 两矩阵和 WeM , 使得族 y ={ A , : 中的每一个成 

员都4以写成 A , = V 2 ,W , K 中每个2,都是“对角”矩阵，证明，对每个>6 AA ) eM m 
和都是正规矩阵的条件是必要的，但是当该族有气个或更多的矩阵时，它不是充分 
的. 提示： 考虑 

-I [::]•[: :]•[-: :] )• 

当该族的矩阵多于两个时，说明关于两个矩阵情形的证明中的哪个部分行不通. 

进一步阅读与注释 Sylvester 于1889年证明 r 关于实方阵的奇异值 分解. 关于一般的 W 
X W 复矩阵的奇异值分解的最早证明似乎是在下文中： C Eckart and G . Young , “八 
Principal Axis Transformation for Non-Hermitian Matrices , M Bull . Amer . Math . Sue . 45 
(1939)，118-121. Eckart 和 Young 的文铁也包含了如下 结果： 两个矩阵 A ， 有奇异 
值分解形式的同时分解（其中的相应“对角 ”因子 都是实 矩阵〉 当且仅当 Afi •和 iT A 都是 
Hermite 矩阵. 关于矩阵族有奇异值分解形式的同时分解的诸多结果的一个综述以及更多的参 
考资料可参看 P . M . Gibson , ** Simultaneous Diagonalization of Rectangular Complex 
426] Matrices /' L/wear Algebra Appl . 9( 1974) * 45-53. 

7.4 奇异值分解的例子和应用 

极分解和奇异值分解有许多 应用. 一些应用在习题中给出，而一些应用在下述例子中 
讨论. 



7.4. 1 例如果 A 6 A ^ 是给定的可逆矩阵，则（关于任一 范数） 与 A 充分接近的所有矩阵也是 
可逆的.在某些统计模塑问题中，需要求一个 在鏺小 二乘意义下与 .4“ 最接近的奇异矩 阵”； 也 
就是希望求矩阵 B 使得 A + B 是奇异矩阵，而 || BIU 越小越好. 

设 HI 是任一矩阵范数，考虑 + + 假定它是奇异 矩阵. 假如 || AMB |||< 

1，由 （5.6. 16> 可知， / + A 因而 A + BfiSI 逆的.于是 1<|A 1 B |<||. A， ，| | B ||,因此， 

如果 /V + ii 是奇异矩阵而 A 是可逆矩阵 • 我们就-定有 j | 如果选 H || 为谱范数， 

乂如果 A = V2W ■是 A 的奇异值分解 • 则 fA , ；!u=|EW2 , V*| 2 -|T-'| 2 = i/ an , 其中 a 是 A 
的最小奇 异值. 于是，使得 A + h 是奇异矩阵的任何13必须适合 ||B| 2 > a (A). 但是，如果选 
择 B 为矩阵 W = V£：W ， 其中 £：= diag (0, 0, 0, 一 久），则 | =| £： || 2 =〜= || E || 2 = 

II BIU . SA + H 就是奇异矩阵（有秩 n — l >. 

更一 般地， 如果关于 Frohenius 范数需要求一个与某个奇异或非奇异矩阵/\“最接近的秩务 
矩阵”，可以这样选择 A +仏 其中 《 = •如前 • 但是 £= diag (0, …， 0, — 〜 +| ，…， 

一•关于这个结果从 Frobenius 范数到所有內■不变范数的推广，可参看本竹末习题1的有关 
证明以及例 （7. 4. 52). 

々==1的情形妗常出现在一些应用中 • 这是值得特別提出来的.用秩1矩阵对某个 
矩阵 A = 的 M 佳 M 小二乘通近是 X = A + B = m +! OVV = Wli a gU ， 0,…， 0) 

W ,其屮， a , 是 A 的 M 大奇异值，而 v 和比分別是 A 的奇异值分解中的西矩阵 V 

和 W 的第1 列. 关于 v 和 u •的一个有用的论断是， v 和 u . 是一对 Hermitc 特征值•-特征向 M 
问题 

AA ' v = < yfv . A ' Aw = a]w 

的单位向 tt 解，其中 w & 半正定矩阵 /\ v \( 和 ) 的 m 大特 征值. 这个论断当然不唯一确定 i ； 

和 U ，： 一个困难是相应于 y 的特征空间不一定是一 维的. 但是，如果 <7?是 AVW 因而是九 V ) _ 
的单特征值，则向 ft v 和 u ， 可确定到相差模为 I 的纯 ii 因子，因此， v 和 w —定是奇异值分解 
A = V 2 W •中两矩阵 V 和 VV 的相应第1列的纯 M 倍..在这个意义下，关于单位特征向 Mv 和 u , 

的确定 选择. A 的最佳秩1逼近必定是形式 〆 a,vuT ,其中 (96 R 是某个实数.我们必须选取 
纯 MW 子 〆 使得 II A — II ! = II A || i-2<„ Retire g A ( vw ' )-]+irf IU III II uj 〖为极小， 

问题等价于使 Re[tre M ( vu ，_ >• ] = KeO VAu ，] 为 极大. 但是 • V 2 W . v 对 

某个成立[见 （7.3> 节习题 5]， 因而丨沪 Au ； 丨 =*7,>0. 因此，最佳纯 M 因子是 
V ' Aw / | I / Mu ， | =7/- Awlax . 而对 A 的最佳秩丨逼近是 

e e a\Viv * = ( v # Au *) vu » * . 

这说明，如果 AV \ 的最大特征值是申-的，则对 A 的 M 佳秩1最小二乘逼近可以奄不费力地通 
过两个 Hermite 特征值问题的解构造出来.例如，使 AA T 为正矩阵，或更一般地为不可约矩 
阵的任一非负矩阵 A 6 iVUR > 就适合 A 7\ 的 ft 大单特征值的条件[见 (8. 4) 节习题】 7). 

7.4.2 例 在定理 (5.7. 17> 中已经 证明， M „ 上的向撤范数 G (.) 能使条件 

G (/… G ( A *> 
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对所有 A ， a 2 ，…，和所有々 = 1，2,…成立，当且仅当 GO ) 在 C ” 上有相容向 M 范 
数.在这个证明中，决定性的一步是证明 • 如果 G (0 满足这个关于谱半径的不等式，则有某 
个有限常数 〃>0,使得（；(4>0(>\ 2 >—^；(.4*»1|弋八^"八*|| 2 ,而证明它的关键是乘积 A , A 2 
… A , 的奇异值分解.其细节在引理 （5. 7. 16) 中. 

7.4.3 例假定想解线性方程组 = ~ 其中，是已知的，且有秩蚁如果 
A = V 2 W •是 A 的奇异偵分解，则 = A •或 

KW' j ：) =V b (7.4.4) 

如果则2的后爪一々行是0,因此，如果在这种情形 T 有解，则必须（同时也只须）使 
4281 VI 的后个元 为零. 于是，方程组在，，1>々时有解，当且仅当6 »5 A 的后爪一々个左奇 
异向域 正交. 如果6满足这个相容条件，乂如果 V =[>, …％]和〜=[叫…叫]，则 （7.4.4) 
说明 

L <7l Ok J 

因而向讨 

•r = ^ (7. 4. 5) 

fi 解 . 因为对所 有）〉 々， Au. =V(2W*tt*) = 0, 所以， A 的后 w — 々个右奇沣向 W (如果冇的 
话 > 的仟意线性组合都在 a 的零空 间中， 因 iw 对任意 〜，， •••• i„ec, 向》 

•r = 2 + 2 ⑶， 

»-*♦ I 

都是 A*r = /; 的解；当然，如果 w = l 就不会出现这后一个 和式. W 为向 M 组 U ，, 丨是标准正交 
组，所以当所冇 ( ,=0吋，就得到具冇极小/ 2 范数的解.值得指出的是， A 的后,,,一々个左奇 
异向 M 张成 AA •的零空间，它与/ V 的零空间相同， ㈥ 此，要求 A 与 A 的后 m — I 个奇异向檄 
正交与要求6与 /V *r = 0 的每个解正交是一问枣. 

练习如果 VI 的后 w — A 个元不全为零，则方程组 / Vr =6 是不相容的，因而根本没冇 
解，但是，为了某些 R 的. 只需要有 “ M 小二乘”解就可以了 • 这个解是使 || — 达到极 

小的，具有极小范数的向蛾 j *. 证明 （7. 4. 5>给出这样一个 最小二 乘解. 

7.4.6 例 用西矩阵的纯《倍对某个矩阵 A € M ” 的最佳 At 小二乘逼近是什么？我们知道， JW ， 
上的 L 范数是由内积 [ A ， B ]= trA / T 诱导的，还知道.如果1/是酉矩阵•则 

II U II? — [U »Lf] = tr UU' = it I = n 
对任意 c € C 和任意两矩阵，有 

WA-cU ||I= IA-cU,A-cU^= l | A || i -2 Re { c [ A , L/]}-f w | c | 2 , 

当< =以，时它达到极小，因而 


429 


如果定义 


A-cV 11!^ || A HI 


I LA,U] | ? . 
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u ( A ) = max ! [.4, L /] : • (7. 4. 7) 

就得到一个与数值半径 r ( A ) 类似的域，对于 r ( A >, 内积的极大值不是针对酉矩阵来取的，而 
是取遍所有 Frobenius 范数为1的秩 lHermhe 矩阵. 但是，与数值半径不问的是，喊数 i /( A > 
& M n 上的矩阵范数[见习题5和例 （7. 4. 54)]. 

要确定的值与欲求的两矩阵并不困难.设 A 的奇异值分解是 A = V 2 W •.则 
w ( A ) = max | [ A ， C /] |= max | [ VZW ' , L /]( 

=max I tr VIW U ' I = max | tr I ( W ' U m V ) | 

«*轉1’ 

a 

=max I [ir 217 | = max 

I I 

W % 

但是，如果 A = PL / ftA 的极形式.则 

tt 

LA , L /] = tr PVV ' = tr P = 

• »l 

W 此，所给出的的上界是可以达到的 • 《(.4>=<^(乃> +…+ 久 （ A >, 乂如果 A = PU 足 A 
的极形 式， •…，久是它的奇异值.则用一个两矩阵的倍数对/\ 的最佳 《小二乘逼近 
可由 

丄 (< 7 | [… -\-(J M )U 
n 

绐出.如果泠定奇异俏分解 .4 = V^VV • 则 L /= VW , 该遥近的误趋是 

•% 鼸 

A 一 > IIA||i-l|[A.L/]| 2 = -士 (S ①)、 

只存当 Cauchy - Schwarz 不等式 

(1>.1) 2 <( 它 10(^>" 

1»1 # T | *•! 

M 等式时误差才为 o . w 此， H 有当/\的所有奇异值都相同时， A 才可以用一个两矩阵的倍数 
来完全逼近. 

7.4.8 例假定 A ， 给定的矩阵，而我们想知道，是否可以通过••旋转” £ i 来得到 A ; 
即 A = [；/3 对某个酉矩阵^^…〃成立吗？更一般地，如果考虑已知矩阵 B 的所有可能的“旋 
转，’仙， 在最小二乘意义下，可以怎样充分地逼近 A ? 这个问题在分析中称为求《的一个 
“强行 （ Procrustean ) 变换”问題. 

要做的计算与上例中的计算是类 似的： 我们试图选择【/使 || A — UB || 2 达到极小，如前， 

计算 

|| A - L/B ||1= LA - UB . A - UB 2 = M || 卜 2 Re [ A ， L / B ] + || B |1|. 

于是，必须求使 Re [ A，=Re trA / T 【/•为极大的丙矩阵 L 7. 如果 AB • = V 2 W •是 AB 的 
夺异值分解.则 
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=Re < y , (AB ' , 

#■1 

其屮 rsC/dsWLr v 是两 矩阵. 当所有 r „ = i , 即当 c /= vw •时，这个和取 极大； w 正 
好是 Afi ' 的极分解的酉部分. 

W 此，用形如的矩阵对最佳最小二乘逼近由 UB = (VW ) B 给出，其中 B 
，而 t / eM ,, 是两矩阵 ， AIV •是 AB ' 的奇异值分解，或 Aiy = P ( VW - )Mi 

AB ’ 的极分解；我们并不需要分別知道 v 和 W . 这个逼近的误差由 
min { || A - Uij || 2 *ae 是西矩阵}= \\ A -( VW ' ) B \\ 2 

=[II A ||?+ ||則|卜 2|>,( A/r )r 

给出，其中 U(Air m 是 Air 的奇异值的集合. 

如果想知道 A 是否恰好是 《 的转动，则一个明敁的必要条件是 II A || 2 = II BIU , 而其必 
要充分条件是 

II All? = 118 11；= ^>,(A/r >， 

其中 U ( A£T >>是 AB - 的奇异值的集合. 

«后，如果考虑 /"= ”及《 = /的特殊悄形 • 便冇以下事 实： 用西矩阵定矩阵 
A 6 M fJ 的 W 佳 M 小二乘逼近由 U = VW 给出，其中 A ^ VIW ' 是 A 的奇沣值分解 $ A = P 【/=- 
/ WVV ') fiA 的极 分解； 逼近的误差是 

|| A - W || 卜 || A ||;+ II / III - 

I ” I 

麟 鬌 #1 

=⑻+ « -巧①⑷= 2 ( 0. ( 泌）一 1>2 ， 

其中是 A 的奇异值的集合. ^ * 

如同上例中的讨沦部分，在所冇两矩阵 L / 上求使 Re tr AU 为扱大的问题的解.为了以后 
参考方便，把这个结果槪括成 T 述定理. - 

7.4.9 定理设 A 6 M ” 是给定的矩阵，且4 = \^〜•是 A 的奇异值 分解. 那么， （ a ) 问题 

maxiRc tr AU：U 6 M m 是酉矩阵} 

有解 L / = VW ， 且极大值是+… +〜< A )， 其中以（.4>}是 A 的奇异值 集合. （ b 〉 存在酉 
矩阵使得 AL / eM ” 是半正定 Hermite 矩阵. 两矩阵1/是使 （ a ) 中问題达到极大的矩阵， 
当 且仅当 AC ； 是 f •正定 矩阵： 如果 A 是非奇异矩阵，则 U 是唯一确定的. AL 7 的特征值是 A 
的奇异值. 

证明： il 算 

«• 

Rc tr AU = Re tr VIW ' U = Re tr Z ( WUV ) = ^Re a ,{ WUV ) u> 

I w 1 

它只有当所有 （ W * LAO , , = 1 时才取极大值.因为 VV •【八/是西矩阵，这又当 R 仅当 VV . 
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或 L / = WV •吋才 成立. 对于 L 7 的这个选择， AU = V^W WV ' = V 2' V * , 乂因为2= diagU , ， 

…，〜）且所有 cr ,> 0 , 所以 AC / 是半正定 Hermite 矩阵. 如果 R 6 是使为半正定矩阵 • 

的任一两矩阵，因为奇异值是两不变的，所以的特征值是 A 的奇异值.对 A 是非奇异的 
情形，以的唯一性可由 （7.3.3) 的唯一性部分推出. 口 

对于任意矩阵 AeM _， 儿4•以及都是半正定矩阵，并且 tr AA =tr = + 

… ( A>，W A •与 A 有相同的奇异值，所以 tr AY 口了看作 A 和 A •的相应奇异值的乘 
积 之和. 这个简单的论断可以推广到任意一对矩阵 .4 和只要乘积和有定义&为半 (432 
正定矩阵.这个结果对研究几 种类® 的矩阵 Si 优化问题有用. 

7.4.10 定理设 AGMm ， B6 Mn.m * ^.q = m \ n { m , w >. 设 •••，< r ,( A ) 和 a 丨 （£0， …， 
q (扪分別表示 A 和 B 按递减顺序排列的奇异值.如果 ABeM m 和是 f •正定矩阵. 

则存在整数 1 , 2 ,…，^的一个排列 r , 使得 

9 

tr AB = tr BA = ^ a ,( A ) a rii AB ). (7. 4. 11) 

f —I 

证明： 如果 m = «， 且 A 和都是半正定矩阵 • 义如果 A 与 B 可交换，则它们可以同时 
两对角化为 A = LMU •和 B = L ； MLr ，其中，•是西矩阵， ^ = diag ( A ,, A ,), M = 
diag (妁，…， fx m ) ,且所有1，^都是非负的.这时，有 

M 

tr Ali = xriUAU ' )(UMV ) = tr UAMU m = ir AM = 

W 为特征值 A ,， p 也是 A 和 B 的奇异值，所以在 m = « 的特殊悄形，定理得证. 

不失一般性，假定因为， _"，>”• 只要在定理的叙述中互换 Z 和 B 就可 以了. 

为了证明定理的一般情形，只须证明，对任意一对使得以及和 BA 都是半正定 
矩阵的 A6M _* BeM _， 存在丙矩阵和有标准正交行的矩阵 V6M _使得变换 

A = VAV 和 {i = V BY (7.4. 12) 

能得到一对可交换的 半正 定矩阵 A 和 6 . 在这种情形，由上述结论可知 

tr AB = tr ADYY ' = tr Y u ABY = tr(V AV)(V BY ) 

= ^ cjAY - AV) ffr<ii (V BY ) = 2^( A )^,(6). 

•-I •，i 

注意到名 •A = v . A - yy > w = VAv \ v =( A \ o ,（ av ), 于是， A 的奇异值与相问， 

因为 （ AVO(AVK ，所以它乂与 A 的奇异值 相同. 同理可证 6 的奇异值与 B 相同， 

由此可得 

两 

tr AB = ^( y , ( A )( Tr <.) ( B ) I433 

- 

这正是所要求的.现在分三步来证明，存在形如 （7.4. 12>的变换，且具有所要求的性质. 

(1) 设 A 和 B 适合定理的假设.由（1.3.20〉可知， BA 的特征值与 AB 的相同（重特征值按 
t 数计算 》 ， 再加上 W — m 个零特征值.如果 A 丨，…， L 是 AB 的特征值，且 AsdiagU , ，…， 

夂），因为由假定可知，和凡4都是 Hermite 矩阵，所以有酉矩阵 t / 6 M ,， 和 V e 使得 




若 V 写成分块形式其中•…且则 V ,是具有标准正交列的矩 
阵.因而 vr 于是 a=lt ,故 /3 A =( v,Lr M «([； vr ). 设 

y ^ uv ; eM _, 并且注意到 w =(/ vrv,Lr = c/ir =/, 则 y 有标准正交行 &ba = 
y 9 ABY. 令 AeY . AeAf ” 和 BEByeM ”， 算出 Afi = y • BA 及 flA = BYT . A = /1 A ; 

根据假定，乘积 BA 是半正定 矩阵. 因此有形如 （7. 4. 12) 的变换（其中 V =/)， 它使我们得到 
一对可交换的” X « 矩阵， R 它们的乘积是羊正定矩阵.但是，单项 A 和6可能不是半正定矩 
阵：不过，我们可以进一步要求形如 （7.4. 12>的变换达到这个条件 • 

(2> 不失一般性，现在可以假定 ， m = / i , A , •可交换， ft 乘枳是半正定矩阵. 

如果且 1 关 0 ， m ( AB )( Ax ) = ABAx=-AABx = A ( ABj ：) = A \ j - = X ( Ax ), 所以 
Hermite 矩阵 A / i 的每个特征空间在/\作用下不变.同押可证.这每一个特征空间也在 B 的作 
用下 不变.因此， 如果 U = 是以的特征向械为列构成的丙矩阵，且相应于的 

同一特征值的所冇特征向 M 相邻地排放4:一起，则 LT AU 和«卩一定都是分块对角矩 
阵，且 

A = U ' AU = diag ( A , , A 2 , …， AJ , B = U 9 BU = diag («, ，…， 

其中 • / V ， B , € M k) . 怂 + …且每个 , 另外 

… • A , fi 半正定矩阵泌 B 的不同（非负）特 征值. ’ 

(3) 不失一般性，现在 珂以 假定 ， m = n . A, /36/^可交换， AB = XI , R A^O. 如果 
()• 则 A 和 B 都是非奇异矩阵，且《=^乃利用 （7. 4. 9) 求两矩阵 L；eAi" 使得 A=A【/ 是 
半正定矩阵.另一方面，因为 A >0, 所以 A isMAU) 1 也是半正定矩阵，因 
lfli(AL；) 1 是半正定 矩阵. 此外， （LT /3)，所以 A 与 
A 可交换.这是形如 （7. 4. 12) 的变换，因此，如果 A>0, 就完成了 证明. 

如果 A = 0， 则 AB = BA = 0. 冉选择西矩阵 （； 使得 AL 7 是半正定 矩阵. 于是 0 = A 8 = 
( AU ) UJ ^ B ) = (V B )( AU )= VOU ^ O , 因而 AC ； 和 IT « 可交换，且 HermUe 矩阵 /UJ 的每 
个特征空间在 IT B 作用下 不变，若 ” = [1^ … u ， n ] 是以 A 【/ 的特征向逯为列构成的西矩阵•且 
相应于的同一特征值的所有特征向 M 相邻地排放在一起 • 则 W ( ALOW 和 W (【/• 

都是分块对角矩阵，且 

W '{ AU)W = diag ( A" …, 丄〉， W (IT B)W = diag(B" …， 艮）， 

A 和是同阶矩阵，而 A ,= A ， f ， /=1，2，…， r ， 其是 A ,， A 2 ， …，是半正定矩阵的 
不同 （非负） 特 征值. 对所有/=1，…，我们有 A , B , = fl , A ,=0. 如果 A •关 ()• 则 A ,= A ,/ 和 
艮=0是一对可交换的半正定矩阵，这正是所要求的.如果 a ,=0， 则 B , 不一定是零矩阵，但 
是，存在酉矩阵 K 使得 L // B , 是半正定矩阵[应用（7.4.9)于衫.]，因而，在这种情形，九 CA 

= 0和 Wfi， 构成一对由形如 （7.4. 12>的变换得到的可交换半正定 矩阵. 这样，对所有可能情 
形都进行了验证. n 

7.4.13 例作为（ 7 . 4.8) 中旋转问题的变形，设 A , 是给定的矩阵，并且我们希望确 
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定，是否可以通过13的两侧“旋转”来得到 A ; 也就是 A = 对某两个西矩阵 L 76 R ,, 

成立吗？更一般地.如果考虑 Q 知矩阵 B 的所有可能的两侧“旋转在最小二乘意义 
下，可以怎样充分地逼近/\? 

如前，我们试图选杼使 II A — UBVMU 为极小的西矩阵 Uf 和 V6R , 还和前面一样， 

算出 

\\ A - UBV \\ l = [ A - UBWA - VBV ] = |M ||!— ， UBV ] 十 || B \\\. 

W 此，必须求使 Re [ A , L /« V ] = RetrAV/T 1/ •为极大的两矩阵和使这个 
问题有极大值的两矩阵 U,，K 一定存在（但不一定唯一），这是 W 为 M n 中和中两矩阵的集 
合是紧集，乂紧集的笛卡儿乘枳也是紧集.使上 述问® 为极大的矩阵 L / u , V u 对仟意两矩阵 t ； 
有性质 

Re tr ( AV ； B * ) U ； ^ Re tr ( AV : /T )17， 

于是，由 （7.4.9) 可知， AV ； B - U ； 娃半正定矩阵，问理可证，对任意两矩阵 V6M W ， [435 

Re tr AV ； H m a ： = Re xriB ' V ： A ) V ,； ^ Re tr B'AV 
于是，仍由 （7. 4.9) 可知， B - WAV ,； 是半正定矩阵，这样，两个矩阵 AV ( 「 【人 • 6 
都适合定理 （7. 4. 10) 的假设， W 为奇异值是丙不变的 • 囚此，如果 (/ 则对 
幣数 1 ，…， g 的某个 W 换 r ， 有 

maxiRe trAV B'V : U ^ M „ 和 V6M . 足两矩阵> 

= Re trAV ； IVV 0 U = )( j t<ll UrUJ ) = 〜 "( B ). 

• • 1 *« I 

不失一般性，我们把奇异值 ( j ,( A )， …， < j ，( A ) 和仍⑼，…,按递减順序排列.如果置 
换: ■不是恒等迓换，则有适合 1 < 1 ,«(/的指标使并旦容易验证，如果 
所作置换互换这两个奇异值的位置 • 则和 

9 

不会减小，亊实上 • 新和值与旧和值之差是 

「' ( A ) (>\ )]:>,<,,, ( B ) — ^ #1 , ( B )] ^ 0 . 

W 此，对恒等置换 r , 上述和达到极大值 • 并且可以得出 

max { RctrAVH - a - : U e M^V e M m 是西矩阵> =(7.4.14) 

其中 A 和《的奇异值都按递减颟序排列. 

把这个结果用到当初求极小值的问题中，对 A ， B6M _, n ) ,求得 

min { \\ A-VBV 和 V € 是西矩阵 } 

==[\\A \\ i -2^0.(, A ) aSB )+ || B \\\]^ 

f ■ 1 

••=i » -1 .«i 





画 1 =[ i , U ( A ) - cy . iB )^ 2 ] 12 . (7.4.15) 

i -1 

特別是， A 是 B 的两侧“旋转”，当且仅当 A 和 B 有相同的奇异值集合. □ 

练习如果《=/， （7.4. 15> 说明什么？试与例 （7. 4.8> 末尾的结果相 比较. 如果 B 是秩走 
的对角矩阵， （7.4. 15) 说明什么？试与例 （7.4. 1>中的有关说明作一比较. 


7.4.16 例作为利用奇•异值的另一个例子，我们考虑刻划矩阵的西不变范数的问题，它是在 
(5.6> 节中提出来的. 

定义上的向 M 范数 HI 称为酉不变的，是指 

|| CM V || = || A || 

对所有和所有丙矩阵成立. 

如果•是给定的矩阵 ， fl A = V 2 VV •是 A 的奇异值分解，则 || A || = || V 2 W || = 
II 2 II 对任意西不变范数|卜|| 成立. 因此，某个阶数的矩阵的西不变范数只与该矩阵的奇异值 
集合有关. 

两个熟知的两不变范数的例子是 F r0 beni US ( E U did ) 范数和谱 范数. 如果 X = [八] 6M _ 
的奇异值是 (</ = min {///, 7t }> •期 

iixii 2 = (22i^ i 2 )-= (S^f) ,/2 . 
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|| X i|| 2 == max = C | o ( X * X )]' ' = < r , = max{ai •••••(?,}• 

对于 M ,_ 上的一般两不变范数 || • || • 它对其 fl 变 W 的奇异值的依赖关系是容易确定的. 
为方便起见，假定 m < w ， 设/ \ = di a g ( i ,，《 r 2 , …， j -.)6 M wt , 然后定义分块矩阵 

X = [/\:0], A 6 06 M_ 

因为 XX . = diag ( U , I I I 2 ,…， I A I :),所以 X 的奇异值集合是 U > = { I a 
如果定义闲数心 （ T — R * 为 

《(：）== g(Oi ， … ， j • 两 ] r > = II x || • . 

则函数 #(•) 从范数 Hi 继承 r 某些 性质： 

(7.4. 17) 私对所有 _ rec - 成立，因为 II XII >0对所有 成立. 

(7. 4. 18) ^( x )=0 当且仅当 _r = 0, 因为 || XII =0当且仅当 X = 0. 

(7.4. 19) ^( ax )= I a I J *) 对所有 C m 和所有 成立，因为 || a X || = | a I || X || 
对所有 a6C 和所有 成立. 

(7.4.20〉 + + 尺 (v ) 对所有 I ， yecr 成立， W 为 II X + y II < II X II + II Y II 

对所有 X ， 


这四个性质说明 #(•) 一定是 c m 上的向量范数，但是尺 （•） 另有两个附加 性质： • 

(7.4.21) 正如 （5.5.9) 中所定义的那样，是 C ” 上的绝对 范數； 也就是说，如果 
- r =[ J - l ] ec \ 且： v = [乂] 三[ 1 1 ,丨 ] ecr ， 则尽 （ 1 >=片（ 3 ^).这是因为 《（ j >= || x || 只与 x 
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上的奇异值 a , =丨 a I 有关. 

<7. 4. 22> 如果是置换矩阵，则 = 对所有 160：" 成立，这是因为久= 

[ A :0] 的奇异值集合与 [ JM :0] 相同，这乂 W 为 （ PA )*( RA > = A * P r PA = A 7\. 函数名 （ hR 是 
o •的各分《绝对值的集合的函数 • 无®考虑它们的顺序. 

练习试计算矩阵 X = LA !0]6 AC •的 一个明 M 的奇异值分解，其中 . Asdiagb , ，…， 

. r M ), 刚才讨论了这样的奇异值分解. 

练习如果 设 ： V = [ A :0] r , 其中 A = diag (* r , ，…， ) 6 M „ ,且定义 g (* r > = 

II x || , j - ec \ 如果 HI 是^..，上的丙不变范数.证明，尺（*)是（:"上的绝对向 M 范数，且 
片 （ Rr >= g(j > 对所有 i 6 C ” 和每个筲换矩阵尸 成立. 

练习直接证明，由 Frohenius 范数和谱范数诱导的向 tt 范数适合上述 （ 7. 4. 17)- 
(7.4. 22) 六个 性质. ' 

7.4.23 定义函数《（.） ： 0 —只 4 称为对称度規函教，当且仅当它适合上述（7.4. 17) — 
(7.4.22) 六个性质，即肖旦仅当 #(•>& 绝对向 M 范数 R /；(•> 是其 fl 变 tt 的诸坐标的置换不变 
函数 • 

我 fn 已经矜到，〜_上的每个 h 不殳范数诱导一个对称度规函数：史有趣的是 k 逆命题也 
成立.下面的定理说明，“_上的函数 〜（•> 足两不变范数，当 Ji 仅当是 A 的奇异值的 
对称度规闲数. 

7.4.24 定理设 IH 足从_上 的两不 变范数 • 并 H ^/ = miii < W ， 设 *r = |>,]60 和 
diag (. r ,, j .,), 当"!<';时.设 或当 时设 X 三 [ X , I 0 ] r 6 从…038 

设片：口 — 1<‘定义为片(4三||\||.则 #(•> 是对称度规函数.反之，如果 CfV 足给定 
的对称®规闲数，乂如果 Ml : M _-> R ♦用 || A || =«((>, ，…， cr v ] M 来定义，其屮 a ，…， 

A 是 A 的奇诗值，则 HI SM _ 上的两不变范数. 

证明： 前一个论断已经证明.关于逆 命题. 我们注意到， W 为 #(•) 是其变请的诸分 W 的 
從换不变闲数，所以 IM 是 M _ 上有明确定义的函数.由于•矩阵的奇异值集合是两不变的， 

所以，对于所有两矩阵和 VeiV ^ •还有 || A || . W 为 #(•> 是向 M 范数，所 
以，对所有都有并&||八||=0 当社仅$以[力，一， aJ T ) = 0 , 而这乂当 
且仅屮所有4=0才能成立，这是因为^(0是正定的（7.4.18>.但是零矩阵是所有奇异值都是零 
的仅存矩阵， W 而函数 IMI 是正定的（见 5.1.1( la >>. 因为 ( r ,( t A )= | <• U ,( A >， 所以 | kA || = 

人 r ([ \ C \ Oif — 9 I r I q _ T )= U i g ( Oi ， …， ^] 7 )= ! (* I II A \\ , 因而 Ml 也是齐 次的. 

至此. 已经证 明了，用对称度规闲数这种方式诱异的任意函数 lh II 是 上的准范数 L 见 
<5.4)]. 剩卜'要证明的是 Ml 适合三角不等式，为此，只需证明 Ml 是准范数的对偶范数， 

[参看 （5. 4. 12) 下面的讨论]因而它实际上也是范数. 

考虑 C 上范数 #(• >的对偶范数 〆 （ •） ： 

^( y ) = maxRc v * x 

" X < T >=« • 

因为^…是 （准） 范数，所以函数只°(0— 定是范数：因为 #(•) 适合 （7.4.21), 所以， 


(7.4.25) 
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(7.4.21'〉如果 £= diag (人 …， 〆 •）,且所有 ft 6 R , 则 

g l> ( Ey )= max Re ( Ey )' x = maxRe y ' ( Ex ) = max Re v ' a - 

=maxRe y * s = g D (\). 

因此 〆 ^(0 也是对称度规函数.从而尺、0也适合（7.4.21). 

(7. 4.22、同理可证，如果是冓换矩阵，因为尺 （•> 适合 （7. 4.22)，所以 
fi n ( Py ) = maxRe ( Pv ) * x = max Re y m P T x = max Re v ' x 

• *<r» = l *" *<x> = l *<Pr»--l 

國 =maxRe v-x' V^^). 

这样，我们可以在上定义与对称度规函数#、*)相关联的函数 M | % 

II = …， a ,] r ), 

找中…，… ，〜是 A 的奇 异值. [这里 • 冇意泛用了一个记号 ： HI " 通常表示范数 H | 的对 
偶 范数； 尽管还不知道 HI 是范数，不过将证明 Ml 是范数，并且证明，今 | 卜 || D 用对称度规 
范数定义时，它就是对偶范数 .] 我们已经证明这个函数 HI 上的准范数，因为它是用 

对称度规闲数 /(•) 定义的. 

现在计算 IMI D 的对偶，根据 （5.4.12), IM D ft •定是”_上的范数.我们知道，矩阵 

适合 || B 『 = 1, 当且仅当 B 的奇》值分解是衫=\^说•[其中，酉矩阵 

2二 di ag ( a ,， …， 〆 （(>•，…， aJ T ) = \. 对于每个給定的矩阵，有 

( || A || l， ) p = max Re [. A,/jj = max Re trAB' 

« ttll n -I I Bl D -1 

= max{Re tr A(VIW ) •: V e 和 W e 是西矩阵， 

2 = diag (5 , ，…， 〜>,ii 

^ D ([si = 1 }. 

对于适合上述约束条件的每个对角矩阵2,我们可以利用 （7.4. 14 H 十算这个极大值，并 fl 能在 
丙矩阵 V ， W 的所冇选择 t 达到极大值： 

( II A || 〒= max { •⑷丨5, I (0 , ，…，〜]。= M 

i m I 

但是，因为所有由定义 （5. 4. 12) 显然可知，这个最大值正好就是在点 ( A ，） …， 
〜（八）] 7 取值的的对偶范数.然而，对偶定理 （5. 5. 14) 保证，范数的对偶的对偶是原范 
数，因而 

( II ^ || D ) D = ⑷，…，〜⑷ ] r > = #(0, ⑷，…，〜⑷ ] r > 三 || A ". 

于是，对所有 II A || =( || A\\ D )\ 它保证 HI 实际上是范数，因而它适合三角不 
等式.这个结论也说明泛用这个记弓是合理的，这是因为，由对偶定理可知， （|| A||) d = 
(( \\ A \\p ) d ) o = || A| | 因此，用对称度规函数 〆 （•） 定义的 | M | D 确实与范数 |M 的对偶 
范数相同. n 

Ml CT 1 上的对称度规函数的一个熟知的重要例子是~范数族 （5. 2. 4) 

尽 ([ 々， … ， jD = II *r II ,=(左 I :• I，)'、 1 < /) < oo. 

1*1 


当它应用于矩阵的奇异值时 • 正如定理 （7. 4. 24) 中所描述的，各种范数诱导了 上的各 
种西不变范数，称为 Schatten p 范数 ， p = 2 的情形是 Frobenius ( Euclidean ) 范数 

Miu = 

t 

〜的极限情形是谱范数 

| A ft = maxia . CA )} , 

而/>=1的情形是迹范數 

SI 球， 

在例 （7.4. 6>中，当考虑用一个酉矩阵的纯 M 倍来逼近方阵的问题时自然要出现迹范数. 

C " 上的另一类对称度规闲数族 4:(7. 4. 44>中给出，它们也诱导出迹范数和谱范数/ 

7 .4.2 6 例奇异值在推导 Wielamit 不等式中起着隶要作用，这个不等式给出了非奇异方阵关 
于 m 范数的条件数的几何意义. 

设是非奇异矩阵，设且用 (7,2 …表示 A 的奇异值.正定矩 
阵 B 的奇值（按约定的递增顺序排列）足设^, 3^ C ” 是任意〜对标准 
正交向 M ， 定义 Zi[j ■乂]且用表示 C 、 的特 征值. r =2 的 Poincard 分 
离定理 （4. 3. 16) 说明 

A* ( /3 ) = a Z m~k^\ ^ A* (C) = Yk ^ A,.* 2 (B) = a\-k • k = 1»2 * 

或 

^ 和 di y ? ( T ?. 

对实际应用来说，在这些不等式中，值得注意的关系是 

^ < X . < y 2 < ( T ?. (7.4.27) 

其中，如果 •! •和 y 是 B 的相应于其特征值分别是 A 的《大 和最小 奇异值的平方的标准 正交特 
征向 tt , 则第一个和 M 后一个不 等式是等式. _ 


经计算， 


Bx )( y m By ) 


'1 ( Jr ' Bx )( y ' By )-\ x " By | 2 
( x * Bjc f * y m By ) 2 — ( j ：' lir — y 9 By ) 

_ idctC _ 

Ttr C ) 2 - ( x * Rr - y - By ) 2 


(7. 4. 28) 


__ 、 ^riYz 

( y . + y 2 ) 2 — (， Rr - y %) 2 〆 ( y 】+ y 2 > 2 , 

K •中等式成立当且仅当 * r ， AC ” 是标准 iF •交向 = y B ： y . 我们把这个不等式变成等 
价的不等式 

― U. % 1 ? __ (Yi-yzV „ /y 2 /y, -]\ 2 …… 


— U W _ < , 4 y , y 2 = / y , ~ y 2 \ z = i y 2 ly x -} \ 2 

( J -* By ) ^ ( y , + y 2 ) 2 Iy , + y 2 / ( h/h + l ). (7,4, 29) 

(7.4.29〉 中的上界是比值 y 2 / yi 的单增函数 [_ 这可用当 />0 时函数 /(/) = (/ 一 1>/(/+1>的导数 
为正的事实来证 明]. 根据（7.4.27〉，这个比值有上界 of / cr〗， 因而 


( J *’ Rr K _ y * By ) 


〆 / <A /ol ~ 1 \ 2 _ (k 2 — \\ 2 

、 U ； /a ； + l/ = l^TTJ * 


(7.4.30) 
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其中，引进了正参数它是八关于谱范数的条件数，如果 

…， 分别是相应于特征值 d 和 d 的标准正交特征向嫒，乂如果0*=(仏+心）/斤 ， y = 

Uru ”、/ 芯， 则 U , /是标准正交组， J - Bx = y - By =( 0 z 1 + al )/2 , 且 ， (d — d )/2 ， 
这时 （7. 4. 30) 中取等号. 

用 cm (0/2)=# c 定义第一象限中的角 I 于是 


r -1 cot 2 ( d /2 ) - 


fl 

并&(7.4.30)可^成形式 


__ cos 2 (办 2) — sin 2 (沒/2) 

cot 2 (沒/2> + 1 _ cos 2 (沒/2> + sin 2 (沒/2) 


= cosd ， 


\^'By \ 




0. 


(7.4.31) 


(， ar)(y By ) 

如果我们注意到这个不等式的左边关于 _ r 和是枣次齐次的，那么最后可以用两种等价的形式 
叙述 Wielandt 不 等式： 

7.4.32 定理设 A6M •是具有谱条件数< 的某个非奇异矩阵，且用 co t(0/2) =/c 定义第一象 
ED 限屮的角心则 

I <Ar , Ay ) |< co »0 II At || 2 || Ay || 2 (7. 4. 33) 

对每对正交向 Mj *, yeC ” 成立，其中〈《， v 〉 三 v •“表示 Euclid 内积，而 IU || 2 = ( tt _ 表 
/!；• Euclid 范数 • 另外，存在一对标准正交向 Mi , . v 6 C •使 （7. 4. 33) 中的等式成立. 

7.4.34 定理设是具有特征偯的某个正定矩阵.则 

(7. 4. 35) 

对每对正交向社^，： yeC ” 成立. 此外，存在一对标准正交向 M ^ r , : yeC ” 使得（7.4.35〉中等 
式成立. 

证明： 在（7.4.31〉中作代换 《 = AV \ 便得到不等式 （7. 4.33), 在 （7. 4. 30> 中作代换^ = 
夂- < M ， 并且考虑到每个正定矩阵 B 具有形式 Z 3= A 7\, 其中 AGM ， 为某个非奇异矩阵，由此 
得到不等式 （7. 4. 35); 可以取 A = B I/2 . 我们已经知道 （7. 4.30) 中的等式对一对标准正交向搶 
成立. □ 

练习证明， （7. 4. 35) 是一般的 Cauchy Schwarz 不等式的改进，它是|， /^y | = 

I 〈（’. y ’ Cr > I ^ II Cr || 2 )1 Cy \\ 2 ♦ 其中 C = B ' 2 . 不过 Cauchy-Schwarz 不等式适应于所有向量 
偶 而 （7. 4.35) 只适用于正交向緻偶.如果 1=4— 会出现什么情况？ 

Wielandt 不等式的形式 （7. 4. 33) 直接导出谱条件数的一个有用的几何解释.如果 o ；， 

C” 是任意一对标准正交向量，则不等式 

I <Ar,iAv> I 


^ cosO 


(7. 4. 36) 


II - 4 r || 2 || |[ 2 

左边是非零向 M/Vr 与 A：y 间的较小的 Euclid 角的通常 余弦. 这个界说明， Aj •与 A ： y 间的较小 
角至多是 (9=<9( A )， 其中汛 A ) 用来 定义. 因为在这个界中可以取等式，所 
以已经证实，当^•和: y 取遍所有可能的标准正交向量时， 0( A > nl 几何地解释为 Ao •与 A ： y 间的 
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最小角.这一论点已在 （5. 8>节和 （6. 3) 节讨论过. 

众所周知的 Kantorovich 不等式容易从 Wielandt 不等式 推出. 对任意 iGC ", 定义 

y = \\x IIKWj -) - ( x m B 1 x)x 9 (7.4.37) 

并 R 注意到 y =0. 经计算， 

By = HjIIIj —( jr # B - l . r ) Hr * 

a - # By = || a || 5 - ( a ** B ' jXx - Bj ), 

y " By =— ( j # B l x )( y a Rr ). • 

因为仏因而 iT 1 都是正定矩阵，我们一定有 yB ： y >0, 因而 y ar =， B ： y <0. 把不等式 
(7. 4.31) 写成形式 

I x m By \ 2 ^ cos 2 0 U 9 Bx )( y m By ). 

然后特意选抒适合 （7.4.37〉 的一对 _ r , : y 代人上式便得 

I x-By | 2 < ( cos 2 ^)( j - B l x )(- x ' By ). 

在，％ < 0 或，％ = 0 两种可能情形， 这 mm ， 对任意 • recr , 有 

- J *' By =-[ II J II 5- U 9 B -' j - Kx * Hr )] < ( cosY >( j •- Bx )( x ' B l x ) 9 
或 ( sin ^)( j -* ar )( j--B ' j -)< || j II ?. (7.4.38) 

应指出的是，如果 >r = W | + M ,, 是 B 的相应于 它的敁 小特征值和 ft 大特征值的单位正交特征向 M 
的和，则 （7. 4. 38) 足 等式. 这就诱导出 Kamorovich 不等式的两种形式，它们与 Wielarult 不等 
式的两种形式相对应. 

7.4.39 定理 设是具冇 ig 条件数 < 的某个非奇异矩阵， M 用 cot ( W 2> =/c 定义第一象 
限的角汰则 

\\^\\\> sin (9|| Ar || 2 || (A )-^|| 2 (7.4.40) 

对所有成立.此外，存在单位向 ttx 使（7.4.40>为等式. 


『•4.41定理设13€^^是具有特征值0<4,<々<〜<义.的某个正定矩阵.则 


II x || }^ Rr )( x - B ' x ) 

v Ai "r A m ) 


(7. 4. 42) 
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对所有 * r 6 C " 成立. 此外，存在单位向 Mj : 使 （7.4.42) 为等式. 


证明： 将衫= 47\代人（7.4.38)，并11能想到 


.\n 2 d = 1 — cos^ = 1 — 


(^) 2 = 


4AA.A. 
(A, + A n ) 


便坷从 （7. 4. 38) 推出这两个结论 •（7. 4. 40>和（7. 4 . *42〉中可能取等式的事实可以从 （4. 4. 38) 中 
取等式的情形推出. □ 


7.4.43 例有时可能要证明某些对所有酉不变范数都成立的关于矩阵的范数不等式，证明的 
关键在于认识到用 

心（了） =- max( I 1+…+| I :1 < 6 < / 2 < …< ,* < n } 9 k = 1, …， w. 


(7. 4. 44) 


定义的 C ” 上的特殊对称度规 函数以 （[\ r , ，…， A ； T > 的基本作用.当把它应用于矩阵的奇异值 
时，正如定理 （7.4.24) 中所描述的，这个特殊的对称度规函数族诱导出^_上的酉不变范数 
族，称之为樊畿々范教.々=1的情形是谱范数， = 幻的情形是迹范数. 


7.4.45 定理设 * r =[>,], )•=[)，, ]€ CT 是给定的向则欠( 1 ><欠( 30 对 C " 上的所有对称度 
规函数 /?(•) 成立，当且仅当 (: v > 对々=1，2,…，《 成立； 其中 《“ O 是 （7.4.44) 中 
所定义的特殊对称度规闲数. 

证明： W 为每个 #“•） 是对称度规函数，条件的必要性是 S 然的.为了证明充分性，假定 
对々=1，2,…，71成立，且设 #(•) 是给定的对称度规函数.由于对称度规函数 
钴其 A 变 M 的分 tt 的置换不变函数 （7. 4.22). 为方便起见， 不大一 般性，我们可以假定 a •和 : y 
的分 tt 的绝对值都排成递增 顺序： 

丨 ! < I J-2 I < …< I :縟丨， I 3^1 1<1 ^2 I < …< I % I • 

_ 于是 A (* r )< A (_ v ) 对所有4=1, 2,…，”成立的假定等价于《个不等式的绀 

I A I < I I ， 

I Jir-I | H -| JC m 1^1 V . I I-hi % I . 

: (7.4.46) 

I 1+ ••• +1 * r _ l<l A I 十…十 I % I ， 

I A 1 + 1 * r 2 I f … +1 1<1 力 |-* I 夕2 I 十… +1 ： y «* I . ( * ) 

这些不等式与关于优化槪念定义的不等式组 （4. 3. 24>间的类似之处不仅仅是表面的. 

如果这些不等式中的 M 后一个不等式 （* ) 不是等式， 通过 缩小分嫩力的绝对值来修改 y 
A 到或者（“）不等式 （* >是等式 • 或荇 (A) 丨义丨缩小 成零. 如果 （/>> 出现在之前，对下一个 
分 WhfiS 这个步骤，如此做 下去？ [到 (“> 出现.其结果将产生一个修正向 《/ = [；/], 使得 
对? = 1，…，《街 | /• | <丨乂丨，对所冇々=1，…，”，有 f ； k ( x )^ t ( y ) , Ji(* >中等式成 
立. 由于绝对范数也是申•调范数 （5.5. 10), 我们有因此，如果我们能证明 
名 (JXWW 对适合不等式组 （7.4.46K 其中的 （* ) 是 等式） 的任意 j*, yeC 1 成立 ，那么可以得 
知， 片对适合一般的（7.4.46)的任意^, ^6C" 也成立. 

假定 （*) 为等式的(7.4.46〉成立就是假定向蛾一丨 I 丨 =[ 一丨 ，丨 ] eR ” 优化向 M —丨 y 丨 
=[一 I 乂 丨 ] eR ’（4.3.24>, fW 在这种情形，我们知道存在双随机矩阵 SeK 使得一 | 了 | = 
• S ( —丨^丨 ） 或丨 a * | =S I >» | (4.3.33). W 每个双随机矩阵是有限多个置换矩阵的凸组合 
(8.7.1)，我们可以把 S 与•成 S 尸丨+…十 ( InPw ，其中， a , ^0, <»| +… + a v = I ， R 每个尸 

是孜换 矩阵.这时，有 

公(了)=片 （ 丨 I 丨 ） 

v n S 

= I I) = ^a,P r I I )< ^g^a.Pi I )• I) = 2 a 'H ( I I)= 只 （ I .v I) 

i»l <-l i -1 

= 片(: y )， 

这是因为 #( o 是绝对向量范数，且 wo 是其自变 M 的分 M 的置换不变函数. □ 

定理的意义在于，为了使 iVL .” 上的每个酉不变范数 || •卩有 || A || <|| b || ，必须而且只须 
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这个等式对樊幾々范数成立，々 = 1，2，…， //>. 


7.4.47 推论设 A ， 是分别具有奇异值和 

>0的某两个矩阵，其中 9 = minUz , 要使 II A ||< || 13||对上的每个西不变范数 || • || 

成立，其充分条件是对所有〗=1, 2,…， （? 有 


而其必要允分条件是 


a . iA ) 


(7. 4. 48) 


(Ji (A) ^o\iB) 9 

CTl ( A ) + <72 ( A ) ^ (Tj ( ii ) -f (T ： (B), 


: (7. 4. 49) 

ji M ) +< y 2 ( A > + … + a ,(/\> < m ( B ) 十… 

证明： 所需要的关键论断是， M „. ■上的两不变范数是其 ft 变盘的奇异值的对称度规函数 
(7.4.24). (7. 4. 48>的充分性只要求对称度规函数是单调范数的亊实 （5 . 5 , 10) ,而关于不等式 
组 （7. 4. 49) 的更为明确的沦断正是前一个定理的内容. □ 

为了应用推论 （7. 4.47) 证明范数不等式，敏述下面的亊实常常珐有 用的： 诸 Hermite 矩阵 
之和的冇序特征值组成的向 W 优化各 矩阵的有序特征值绀成的向 M 之和. 


7. 4.50 引理设/\，是具有有序特征 — 和的 

Hermite 矩阵，乂设 A , (/\ — …： A -扪 衣示 A — B 的有序特征值.则向世 

A(A)-A(/i) = [A.(A)-A.(B)] 

优化向 WA(A —= — 即 

* « 

对先=1，2,…， ” 成立，其中等式对 ♦= ” 成立. 

证明：定理 （4. 3. 27) 说明，由 A — 的特征值组成的向址 A ( A )= A ((/\ — i 3) + fD 

= [ A,((A — 优化向量 a (4 — B )+ A ( fi ) = 0( A - B )+ A ,( B )], 它等价于向锨 A ( A ) — 

A (⑴优化向 tt A(A — B >. q 

以 （7. 4. 47) 中的条件及上述引理为工具，常常可以把关于范数或谱范数的逼近定理或不等 
式推广到整个丙不变范数类. 

例如， （7.4. 15>说明，如果 A , HEMf 是分别具有有序奇异值 — 和 

的某两个矩阵， ftgsniin 彳 // I , W ， 则 

IIA-B|| 2 ^ ( 公 [ct,(A> -mb )] 2 广 

表示这个下界的另一种方式是 ^ 

彡 II 2( A ) -2( B ) || 2 , 

其中， A^V l I(A)W ； 和 B = V 2 2( B ) W / 是奇异值分解， 2( A ) 和 2( B ) 的“对角线，， t 的相应 
奇异值按从最大到最小的顺序排列.这种不等式的另一个例子是 （7. 3.8( a ))， 它是关于谱范数 
的. （7. 4. 15) 推广到所有酉不变范数就是取这种形式. 
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7.4.51 定理设 .4, 2^从_是具有奇异值分解 A — 和 B = V 2 2( B ) W / 的某两个 
矩阵，其中， V ,, 和 W ,， W26A1 是酉矩阵，而 2 ( A ) 和 2 ( S > 的“对角元”都按递减 

顺序排列，则 II A-B\\ > || X(A)-KB) || 上的每个丙不变范数 | M 成立. 

证明： 设 7 = min 彳" 1 ，利用 （7. 3.7) 把 A 的夺异值 

(ji(A) ^ ••- ^ (7^(A) ^ 0 

与 Hermite 矩阵 

~ r 0 Ai 
A = I . e M … 

La o 」 

前 v 个非正特征值对应起来，； i 的 //i + w 个有序特征值是 

o \ (A) ty 2 (.4) < … < r v ( A ) < 0 =…= 0 < ( j v ( A > < … ^ < j | ( A ), 

对 B 和; i — 也 可以作类似的 对应. A 与 /) 的有序特征值的差足土 !>,(々> 一 …， 

±[ cr ,( A )（ B )] 以及< | m — w | 项 >0. M 然如何排出这个序列的顺序一般是不清楚的，但 

是，按照这个序列的顺序，</个 最小的元是卜 U ( A > — a ,( B ) | }, 把引理 （7.4.50) 应用十 A , 

B 和 A —便使我们确信 

* * 

yi -~nSA B) min l V] — | a, (A) — a, (B) I : 1 < … } • 

.• • I ，- 1 ' 

对6=1，… • （/成立，它等价于 

* k 

y]a,(A — B) ^ max j ^ I a, (A) — <r, (B) | ： 1 ^ 

/ -I 

对 々=丨， …， 7 成立. 因为 < U (/\)— a,(m I >坫 2(.4> — 2( B > 的夺异值的集合，推论 
(7. 4. 47) 保证 || A-B ||^|| I(A)-KB) ||对任何两不变范数|| • ||成立. □ 

7.4. S 2 例定理 （7.4.51) 的一个推沦足，对 P 在例 （7.4 .丨）中所考虑的关于 Frobcnius 范数求 
某个矩阵 AeM ,, 的 （ ftM 小二乘意义下的） M 佳秩々逼近问题作推广•如果|卜||是丙不变范数， 
乂如果 Beiw ” 有秩々，则 m (⑴>…(扪于钻， 

II A - H II > || 1(A)-KB) II 

=|| diag((j, (A) — o\ (B) ♦••• — <j*(Z i) •a* H (A) ，…， >) || 

^ II diag (0，“. •0，(7 * H ( A > ，… > || • 

其中，我们用 到了对 角矩阵的酉不变范数是单调范数的出实 ， 这是因为它是诸对角 7 ii 的对称度 
规 函数. 另外，当 《 = •时可能取等式，其中 ， A = V 2( A ) W •是 A 的奇异值分解，而 

diag；_(Ti (A) , (7*(.4) ， 0 ， … ， 0]. 

W 此，对任意 .46 M ,, 和秩为々的任意关于任意两不变范数冇下界 

[A — B \ 1 ^ || diag (0 •…， ( A ), …， a ”（ A >) || 

^ o H (A) || diag(0, …， 0, 1 ，…， 1 > !| 

(最后一个表示式的对角线上有纟项零），其中，第一个不等式可以是等式，而第二个不等式一 
般不取 等式. 第二个不等式（如果 A 是非奇异矩阵，该不等式完全可以从对称度规函数的单调 
件推出，而如果 A 是奇异 矩阵， 则结论是明显的）有以下 优点： 它对范数的依赖关系只是々的 
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函数而不是 A 的函数.特别是，这说明，对任意非奇异矩阵 A 6 A 1 和任意酉不变范数 IM 有 
M 大下界 

WA-B || 彡久 （.4) || diag (0，...，0, l > || , (7.4.53) 國 

它对 A 与任意奇异矩阵 / i 间的距离 成立； 即/\到夺异矩阵所组成的闭集的最小距离（关于酉不 
变范数 IMI) 是％ ( A ) lldiag ( O , ••••()• 1) ||. 

7.4.54 例我们可以利用对称度规闲数的性质给出上的两不变范数是矩阵范数的简中•特 
征. 如果 1 | • |||是上的丙不变矩阵范数 • 则从推论 （5.6.35) 得知 • |0|||^1 1 (4)对所有46从 | 

成立.利用定理 （5.6.9) 和上的每 个两不 变范数是 A 伴范数的事实（见习题2)，用论断 
[ ct 1 ( A )?= a ,(/1* A )^||| A*A liOli A ' j : tA!||=M I ? 也可以宵接证明上述 结论. 另一方面，设 If • I 
ffi 使1 对所冇都成立的 M , 上的两不变范数，乂设 g 是由 I • li 秀导的 C ' 上的 

对称度规函数.利用 7. 3节习® 18中给出的类似于 Weyl 不等式的关于奇异值的乘法不等式以 
及《楚平调范数的负实便可推出 

1|= ^( cr , ( Ai 3>，( x 2 (AB >,… .^( Aii )) 

^ ^ r ((Ti (A )(7, ( li ) (A ) a 2 ( B ) t ••- ,(ji ( A ) er n ( B )) • 

=< T | (. A )^( cT | ( ⑴， (72( ⑴•… 

= ^,( A )|| « I |< I |. A|E f B I 

W 此， M ” 上的酉不变范教 ! fl • A 是处阵 范教. 当且仅当 t 对所有成 
立，特別姑 • 所有 货畿々 范数，々=1，2，…， ”• 以及所有 SchfUten /) 范数， [_ 它们分 
別是由 （7.4. 中的对称度规函数及 （5.2. 4) i 秀导的足矩阵 范数. 这个特征的另一个推论是， 

上的酉不变矩阵范数所组成的集合是凸集 • 上的所有矩阵范数所组成的集合不是卩>!« 

[参乔（5.6>节习题 9]. 

习题 

1. 设秩々〉 0. 假定求一个秩为 t 〈々的 矩阵要求能按 Frohenius 范 
数最佳過近 A . 说明这可以按下述方式 进行： 

设/ \ = A 的奇异值分解.设2,除了仅取％, •••• %而其所余下” 一怂个 

元为零以外，2,与2是相 问的. 于是 A ,= V 2, W •有所要求的性质 . 提示： 利用 （7. 4. 15) .注 
意到（7.4.52〉证明了所给逼近不仅关于 Fmbenins 范数是佳”的，而 JI 关于所有两不变范数 
也是“最佳 ”的. 

2. M , 上的范数称为自 伴范教， 是指 II A || || A - || 对每个 A 6 M m 成立. 试用定理 

(7. 4.24) 证明， iW ” 上的每个西不变范数伴范数.试给一个是 fHf 范数而不是两不变范数 [450] 
的例子. 

3. 试用定理 （7. 4. 10) 和例 （7. 1.6>的方法来确定， ffl —个具有标准正交行的矩阵 ye / W … 

的纯 M 倍对一个给定矩阵(其中的最佳 ft 小二乘逼近.提示：证明，这样的矩 
阵 Y —定有形式 Y = VDW ， 其中 VeiVL 和 WeiW ， 是两矩阵 ， D = [/ 0]6 M _, /6 M,,,， 而 
0€M ; .,„ 极小化 || A-cY ||?的问题与极小化 i | A ||?- (Re tr AY ' ) 2 / m 是相同的.如果 
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八=%2^7是 A 的奇异值分解，说明这个极小化问题变为求 

max Re triIWD m V：W 云 和 V € M, n 是西矩阵 h 
然后利用定理 （7. 4. 10) 解这个如同例 （7. 4. 13) 中的问题.说明这种情形下的误差值与例 
(7.4. 6) 有相同的形式. 

4. 考虑对角矩阵 A , 证明所有可能的排列 r 可以出现在 （7. 4. 11) 中. 

5. 考虑 （7. 4.7) 中定义的函数 《( A >. 证明 

w( A ) ^ y/n II A II 2 

对所有且这个界是可达 到的. 试用定义接证明 《( A ) 是 A 1 上的向 M 范数，并 
且说明为什么 《( A ) 实际上是 H , 上的矩阵范数. 提示： 参看例 （7. 4. 54). 

6•证明，如果 A 6 M ,, 是非奇异矩阵， R / c ( A >= j|A y 是 A 关于谱范数的条件数， 
则 <(々）=",/仏，最大奇异值和最小奇异值 之比. 这如何同估计以 A )> | A , AU 作比较？ 

7. 证明 Kantorovich 不等式 （7.4. 42>中的常械是义，和的儿何平均值与 A , 和的算术平 
均值之比的平方. 

8. 设是非奇异 Hermite 矩阵.试用 Kantorovich 不等式 （7. 4. 40) 证明 

max = + 

'一 0 II J * II 5 2 \ a m a \) 

其中是 A 的奇 异值. 证明 a , 和 ( T ■分別是 A 的诸特征值的 ft 大绝对值和锻小绝 

051] 对值， jfiliiE 明 

j(°t + a f ;) = b K+K 

其中 / c 是 A 的谱条 件数. 给出一个向* j •使上述极大值可 达到. 利用谱条件数以及它与上而所 
定义的极大值的关系 • 说明为什么有 


直接证明这个不 等式.提示： 证明对于^ •彡1, /(x )= i -[>+( lAr ) J /2 是增函数. 

9 - 设 U ， …， L 是 w 个给定的正实数.试用 Kantorovich 不等式 （7. 4. 42) 证明，如果 
%，•••，〜是非负的，且其和为1,则 

#» I \ * 雌 1 心 , ^AfMx/inun 

10. 证明（属于 Greub 和 Kheinboldt 的） Kantorovich 不等式 （7. 4. 42) 的下述 推广: 设 B •(: 
6 M ” 是交换的正定矩阵，分別有特征值 — 和— ，则 

(:• BCx ) 2 ^ — ( J - B z x)U - Cx) 

对所有 iGCT 都 成立.提示： 因为对某个西矩阵 L / eAl 有•和 C = L / M (7. ，先用 jy = 
【广 X 写所要求的不等式，然后用 2 =( AM ) l /2 ： y 写不 等式. 于是代朽=八/^ | 应用（7.4.41厂可证 
明所要求的不等式成立（且可取等式>,并且对于指标的某个选择有形如 

X\X m fX,tA k 

( Ai / i > H - X H fi k ) 2 



的常数.证明这个形式的 M 小常数当 ）=1 和々=〃时出现.但是，这最后的推广不等式不可能 
取等号. 

11. 简化 Kantorovich 不等式 （7. 4.42)，证明，若是正定矩阵，则对所有 . rGC M 有 

(， Rr )( j . B ] x ) > || j - || J . 

更一般地，若是正定矩阵，证明，则对所有 I , . vec ” 有 

( j . Bx )( y ' B ' v ) ^ W . v ) 2 , 

其中等式对 = 、成立. 由此得出对所有有 

(j - j -) 2 < (- r - Rr )( s ' B l x ) < x ) 2 . 

提示： 如果 A ,>0, 证明 

然后 id B ^ UAU \ 

12. 设是正定矩阵，是任一非芩向 M , ft 定义 

证明/(仏： y ) 是冇意义的，然后利用习跋 11 证明 /( B , y ) = l / y-B 1 y . 证明 / 具有超加性性 
质， 即对所有: y 6 C ” 和所有正定矩阵 /\， B 6 M , M 

现在设 J = C C 是第/个标准单位基向然后推出 Bergstrom 不等式 

det(A + 13> 、 det A , det B . _ . 

det ( A , + ii ,) ， det A , det H / 1 — * * * W 

对仟何正定矩阵 A ， hlii , 其中，表示划去 A 的第 / 行和第 f •列得到的 A 的主 
子矩阵，汉的意义 类似. 这种接近于 Bergstrom 不等式的方法是有蓿广泛用途的所谓 拟线性 
化方法的一个应用 实例； 拟线性化是把一个所考虑的 M 的非线性函 数表以 成另一个函数的约束 
极值，而这个新函数线性地（或许只是加性地）依赖于所考虑的埔.在 （7. 4.24) 中的关键步骤 
(证明用奇异值的对称度规函数定义的上的准范数实际是一个 范数） 是用 （5. 4. 12) 中的拟 
线性化完成的. 

13•对十任一复数6不等式 I z —Re 2 | < | z — j . | 对任何实数 j * 成立. 这个不等式到方 
阵 A 6 M . 的看似合理的推广是 

A--i(AH-A') < IU - H || 

对所有 Hermite 矩阵 H 6 M ,, 成立. 证明，这个+等式对所有两不变范数|| • ||以及更一般地对 
所有 S 伴范数 成立. 由此得出，（关于 Ml ) 从一个给定矩阵 A 6 M „ 到由中的 Hermite 矩 

阵组成的闭集的距离是士 ||A — A . II . 提示 ： A — 去 (A + A . ) = + ( A —+ 去 （H — A .) ，因 
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To ! 


iTil 


士 <A + A. 


<j IIA - H ||4-||| H - A * 


II . 


14. 对任意复数 z ， 有不等式 I Re H < U 丨 . 证明它的明显推广 II (A + A - )/2 || < || A || 
对所有 A 6 M ,, 和所有酉不变（甚至 fl 伴）范数 | M 成立. 


15. 设是给定的， 夂是 + (A + A _ )的冇序特征值，乂设…是 A 
的有序舒异值.说明为什么不等式 


A,r-** 丨 + .4. ] ) ^ (T* (A) , k = 1 ，…， w 

可以苻作关于 S 数的不等式 Rr ： r < I Z 丨的一个 推广. 这个不等式是说， A 的第々个 M 大奇异 
值大十或等于 ) 的第々个最大特 征俏.提示： 若 y 是 Euclid 单位向嫩，则 


|y(A + A' v =R e yA. v < || A 夕 II，. 

用 Courani - Fischer 定理 （4. 2. 11) 表示 A •…" 然后用这个不等式和 （7. 3. 10) 得到办. 

16•设/从，是给定的，又设 IM 是 iV ^ 上的一个两不变 范数. 利用（7.4.51〉证明， 
II A —【/|| >|| 2( A ) — / || 对任一两矩阵成立，且这个不等式可取 等式. 由此得出 
112( A ) /||是（关于 HI )从/\到由中的两矩阵组成的紧集的距离. 

17. 设有奇异值分解 A =\ a ( A)W , 乂设 HI & A 1 上的两不变 范数. 证明 

112 (A)-/" < IIA - (； || < || 2 (A) + / || 

对仟何内轵阵 成立.提示： 证明， ft 仟一两矩阵的任一夺异偯分解中有2(1；) = /，于 
足从 （7.‘1. 51) ff 接推出下界成关于上界，利用 （ 7.3> 节16题中 类似于 Wcy ! 的加法特征值 
不等式的奇异值不等式证明 ( M , ,( A +(- l 7) X < y .(/\)+< y > (- l ；). 然后用 （7. 4. 48〉. 

18. 试以例 （7. ‘〗.53>中关于非命异矩阵 A 的不等式为指南，求 || A — B || 的 M 大下界，其 
中， 是给定的秩々，矩阵，飪任意秩 Ad 坧阵，而 HI 是两不变范数 • 

进一步 阅读. 定理 （7.4. 24 >w = « 的情形的 ft 初原铟诚于 Von Neumann ; 可参看 （5. 4) 节 
引用的 文争. Wielandt 和 Kantorovich 不等式取 ft [Hou 64], 并 且作/ ■改编 ， [Hou 64] 还有 
M 许多原始资料，有关的推广以及其他资料可参矜 A . Clausing , M Kantorovich-Type 
Inequalities ," Amer . Math . Monthly 89(1982). 314-320. 习题 12 中接近于 Bergstrom 不等 
式的方法取它用一大章（还有大 W 的参考资料 >专门论述由 IT •定矩阵引起的诸不 等式； 
并且对拟线件化方法也有讨论，还给出 r 许多 例子. 关于对所有两不变范数都成立的诸不等式 
的其他资料可参看 L . Mirsky , ••Symmetric Gauge Functions and Unitarily Invariant Norms ，，， 
^ uart - J - (liford 11(2)( 1960), 50-59 以及 K . Fan and A . J . Hoffman , “Some 

Metric Inequalities in the Space of Matrices , M Proc . Amer . Math . Sue . 6(1955), 111-116. 
例如，这些结果如何应用于统 U •学以及有关统计学文献的其他资料可参肴 C . K . Rao , 
Matrix Approximations and Reduction of Dimensionality in Multivariate Statistical Analysis ，，， 
Multivariate Analysis - V , Proceedings of the Fifth International Symposium on Multivariate 
Analysis . P . R . Krishnaiah , North - Holland , Amsterdam , 1980， pp . 1-22. 
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7. 5 Schur 乘积定理 

一个特别简单（乂形式 自然） 的矩阵“乘法”是按对应分 M 相乘. 

7.5.1 定义如采和 B = 是给定的矩阵，则 A 和/彡的丨^抓以^乘 

积是矩阵 A ◊ B = U > 4； ]6 M _. 

常常称 Hadamard 乘积为 Schur 乘积. 像矩阵加法一样， Hadamard 乘法是可交换的 ， W 
而它 比普通 矩阵乘法要简单得多. 

Hadamard 乘积 ft 然可以从儿种不同的观点产生 出来. 例如， /((?> 和片 ( W 是周期为 2 tt 的 
连续周期闲数，又如果 

“* = |"^/(^) d (9 和 b k - ^\^^{ 6 ) 60 , 

右= 0，士1，士2，…，则卷积 

h ( 0 ) =^ f ( d - t ) K u)dt 

有三角矩 

(.* = 

它适合恒等式 t * =“*/»*• 々 = 0， 土丨. 土2， •••• 于是， / i ( 们的三角矩的 Toeplitz 矩阵是 /( W 和 
〆 ⑴的三角矩的 Toeplitz 矩阵的 Hadamard 乘积： 

[<r >] = [“,-_>] 。 J - 

如果 /( ㈧ 和只 (60 都是非负实佾函数，则按积 M 幻也 s 非负实值 闲数. W 此，如 （7.0.5) 中所证 
明的那样，矩阵 [“，，],U ,] 以及 [>••,] 都是半正定矩阵.这是 Schui ■乘积定理的一个实例， 
该定理 是说： 两个半正定矩阵的 Hadamard 乘枳是半正定矩阵. 

乂如，考虑积分算子 

K (/) ― J K f ( y ) dy , 

其中，核 K ( j *， ： y ) 是夯限区间0, b ~\ X [ a , /，]上的连续闲数，& /6 C [ ci , b ' l 如果我们有第 
二个核 f / G , — V )，则珥以考虑（逐 点） 乘枳核/-( I ， y ) = K ( x . y ) H (: r , >0和相关联的积分 
算子 

• Lif ) = J IAx , y ) f { y)dy = J K ( s , y ) H ( x , y ) f ( y ) dy . 

线件映射 /—/ C (/) A 然是矩阵向域乘法的极限（把积分看作有限 Ri emann 和的逼 近）， 并辽 
积分算子的许多性质可以通过对矩阵的已知结果取适当的极限 导出. 从这个观点出发，积分核 
的（逐点）乘积导出一个积分算子，它是类似于矩阵的 Hadamard 乘积的 A 然的连续形式 • 

如果积分核 / CQ , >0有以下性质， 

J J K ( a '，，)/、 j >/( 30drdy > 0 

对所存 / eC :[. a ， 6」成立，则称 K ( j *，_ y > 为半正定核，一个经典结果 （ Mercer 定理） 是说，如采 
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K (. r , y ) 是有限区间 [«, A ] 上的连续半正 定核， 则存在一组正实数 U , 丨（称为“特征 值”） 和一组 
连续函数 K (* r )} (称为“特征函数”）使得在[〜 b ^ Xla , A ] 上有 

KU,y)=^*' U ^ (y \ 

.-I 

且该级数绝对一致收敛. 

如果 K ( i , 和 mi ，： y > 是同一个有限区间[〜 6] 上的连续半正定核，则 H ( or , >0在 
U , A ] X [ a . 糾上也有绝对一致收敛的表达式 


HU . y ) = 


其中，所有的 p >0. 根据相应级数的直接乘法，（逐 点〉 乘积核 U * r , y ) = Kix . y ) H ( x , y ) 
在 O , 乂 | X [〜 A ] 上有表达式 

L(.r,v) - 2 ^(.r)^(j-)j»,(3>)^(3 >) ， 

它汍绝对一致收敛.于 


J J v ) djd >» = 2 I [ /( j -) dj - >0, 

W 而 Ux , : y > 也是半 IK 定的 • 这是 Schur 乘积定理的另一个 实例. 

练习证明，两个 Hermite 矩阵的 Hadamard 乘积总是 Hermite 矩阵，但是，两个 
HcrmUc 矩阵的#通矩阵乘积是 Hermite 矩阵，当 R 仅当它们是可交换的. 

练习考察矩阵 A=C |]|« B =^ 5 •证明， B 和^。 S 是半正定矩阵 • fW 普通 

的矩阵乘积/不是 半正定矩阵.但是可 以证明 AB 的特征值是正的. 

4:这里引进 Hadamard 乘积的主要理由是 • （不同于普通矩阵乘积）它使由诸半正定矩阵组 
成的锥不变，它还给出了半正定矩阵和 非负实 数间的另一种类似.我们从一个具冇独立意义的 
论断开姶. 

仟意矩阵可以衣水成一些秩1矩阵的和，其中被加矩阵的个数等于该矩阵的秩，而对于半 
正定矩阵，被加矩阵也可以选为 f 正定矩阵. 


7. S .2 定理如果 Z \ eM „ 是秩 A 半正定矩阵，则/\珂写成形式 

i^Z] A = !；,!», * + V 2 V; + …+ V k V t ' * 

其中，每个 v , ec ”， 且 U , ，…，％}是作零向 M 的正交组. 

证明： 利用谱定理将/\写成 A=LMCT ,且设从是 L 7 的第 I •列的 A ! /2 倍. O 

我们的主要结果常常称为 Schur 乘积定理. 


7. S .3 定理如果 A ， B 6 M ,, 是半正定矩阵，则/\。《也是半正定 矩阵. 此外，如果 A 和/3 
都是正定矩阵，则也是正定矩阵. 

证明： 利用 （7. 5. 2) 记 A = + … +!/*!；*• 和 + … + WUC ，其中 々 = rankAR 

w = rank H . 注意到 
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k 9 m 

A 。 B , 

其中、。叫. 因为 A 。13 是（秩 1) 半正定矩阵之和，所以 A 。13也是半正定矩阵. 

如果/\和衫都是正定矩阵，则々 = ///==«，且向量组{仏丨和{比，丨都是 C ” 的正交基.尚若 
A 。月是奇异矩阵，则存在某个非零向 M J •使得 （ A 。 B>.r = 0, 因而 

kmm 

• r . (/\。 B)x = ^]- r * ( w,>wj >j = | 〆 | 2 = 0. 

另一方面，每一项必须分別为零，因而 ' 

I S a u„ I 2 = I (v, 。 u ， , ） I 2 = I (j* 。 i,> * It ，， I 2 = 0 
对所有 ^ 和） 成立. 这说明，对每个/，向贵》 v , 正交于所有向 ftit ，，， W 2 , …，叫， W 此， 

上。&=0对所有/=丨，2，…， n 蚊. 特別是，这甩涵 = 0对所有/=1,… 成立. 因为 
这意味蒋 * r 与基的所有元素正交，所以一定有 *r = 0. 由此得出 A 。定是非奇异矩阵. □ 

练习设 A , BeK . 试用 (7.5. 3>的证法证明，当 A 和 B 是半正定矩阵时，总有 rank /\。 
B<(rank AHrank B ). 特别是证明,如果 （rank A)(nmk B >< Oi ， 则 A • B —定是奇异矩阵. 

练习证明，当/\和《是 Hemiite 矩阵而不一定是半正定矩阵时，上述练习的论断仍然 
成立. 國 

S 习考察矩阵/\=匕^和 B == l ^ 说明，即使 A 和 B 都有正的秩 ， rank A 。 B 
也可能是零. 

维习证明，如果/\楚正定矩阵而 B ft 负定轵阵，则是负定矩阵. 

7.5.4 推论 （ Fejer 定理） 设/\ =[心]€^^,则 .4 是半正定矩阵当且仅当 

_ 

2>. A)o 

对所冇半正定矩阵成立 • W 

证明 ：假定 a 和 b 是半正定轵阵， n 设 * recr 是所有分嫩都等于1的向 st 于是 
是半正定矩阵，而且正好是 X . ( A 。 B >* r ， 它肯定是非负的.反过来，如果当 B 是半正 
定矩阵时有彡0,此时对任意给定的向 M i 6 C •令 B = 于是 B 是半正定 

矩阵，且 

W H 

X ]“•九= Dak = - r * At > 0. 

■丨 》.广 I 

因为 J * ec ■是任意的，由此得出 a 是 f •正定矩阵. n 

7. S .5 应用设 DCR " 是有界开集.由 

Lu = L + S A ' (x) -^-c(s)u (7.0.6) 

给出的 c 2 ( d ) 上的二阶线性微分算子 l 称为在 d 中是椭 a 型的，是指对所有的 leu , 矩阵 
= (1)1 是正定 矩阵. 假定存在某个它在 D 的闭包上连续且在 D 中适合方 
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程 Z ^ hO . 关丁函数《在0中的局部极大和局部极小 • 我们能说些什么？假定是关于 w 
的局部极小值点.于是对所有/=1，2， ••••/! 有 

夺=0, 

V 


并且 Hessian 矩奸: 




在点，足正定的. W 此. 在点 y 有 

U = 0 = .$ l a °^7： + ru， 

并目由 Fejer 定殚 （7.5.4) 可知，含有二阶导数的和必须是非负的，因而项必须是非 
正的.特別足，如桌 t ( W <0, 则不可能有 W (. V ><0. 同理 SJ 证，如果（.(>，）<()， W (： y > 不可能 
在相对极大值内点^ 为正. 这些简单的结论就是下述觅要原理的要点. 

7. 5.7 弱极小原理设用 （7.5. 6>定义的算子 f •为 D 中的椭圈 SJ 算子,且假定在 D 中 C (« r )<0. 
如果 “6 C ”（ f))A D 中适合 /.« 三0,则“不能有负的相对极小值内点，或荇不可能有正的相对 
极大伉 点. 此外， 如果“ 在 /) 的闭包 t . 连续卩1作/)的边界上非负，则 w 中必定处处非负. 
从极小原理洱以推出偏傚分方程的一个基本的唯一性定理： 

7.5.8 Fejci •唯一性定理假定 7. 5. 6 >定义的裨+ L 足瓶 WI 型的 • 设在 /) 屮并 H 
考虑下述边值 问軸: 

ft . D 中， Lu ^ f , /钻已知闲数* 

泎上， g 足已知闲数； 

在 f ) 中，“二次连续可微： 

D 的闭包上"连续. 

则这个问题至多存在一个解. 

证明： 假如“ ，和々是这 个问题的两个解，则闲数 ，—心 是间一类型问题的一个解， 
不过 H 冇零边值条件且在 D 中 Lt ；^=0. 由弱扱小原 殚可知 • ft D 屮 v 必须 非负. 把同样的论 
证用于一％得知 p 在〖）中也必须非正， W 而在 D 中 i ；=0. □ 

练习说明弱极小 原押和 Fejer 唯一性定理如 何戍川 〒 DdR n 中的偏微分方程 V 2 u — A « = 
0. 其中 A 是正实参数. 

Schur 乘枳定理的最后一个推论是容易证明的.如果是半正定矩阵，那么 
A 。 A = [_4] 也是 f •正定矩阵.由归纳法可知，对所有 （=1, 2,…，所有正整数次 Hadanard 
幕「41是半正定矩阵 . 因为羋山定矩阵的仟意非负线性组合是半正定矩阵 （7. 1.3)，这蕴涵， 
只要所有+>0， 

饥 A 项 

+ a { A 4- a 2 A 。 A + …+ «一/\。…。 A = [«：, + + “ 2 t 4 + …+ a m aT ,~\ 

= [〆％)] 

就是半止定矩阵；十⑷ I 十…十‘了"*是非负系数多 项式. 更—般地，如果 
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fiz ) = ^ a k z k 

是解析函数，其中所有 fl 收敛半径尺>0,则经简单的极限证法可证，只要所有丨~丨 
<尺， [/( A )] eM , 就是半正定矩阵.或许最简单的例子是 /( Z )= 〆 ， 其幂级数对所有 zee 
都收敛，它的系数是“*==1/幻 >0. 根据这番证明，只要 A = [^]6 A 1 是半正定矩阵，[八] 
就是半正定 矩阵. 这个结果还可以 改进； A 的较弱条件足以保证以 A 的分 * 为指数的矩阵是 
半正定的.见 [ HJ ]. 


7.5.9 推论设 A =[ 心]是半正定矩阵.则 

U ) 对所有々=1，2, …， 矩阵 [ O 是半正定矩阵. 

( b ) 如果/(2>=如+^^ + “ 22 ： 2 +…是具有非负系数的解析函数，且收敛半径尺>0，则当 
所有丨 A 丨 <尺时，矩阵[/(心>]是半正定矩阵. 

习题 

1. 证明，如果 H (/\)( A 的 Hermite 部分）是正定矩阵， ft ii 是正定矩阵，则 f /( A 。是 
正定矩阵. 

2. 如果 A = [〜] 是半正定矩阵，证明矩阵 [| 〜丨 2 ]也是半正定 矩阵.提示： 考虑 A 。 A . 

3. 如果 A = [ ti y ] eM ” 是半正定矩阵，证明对所有 A 6 R ， 矩阵[ 〆 ” A ] 是半正 定的. [461 

4. 如果 A = O y ]€ M ” 是中•正定 矩阵， 则正数次 Hadamard 幂矩阵 A ⑴和 Hadamard 绝 
对值平方矩阵 A 。 A 恒为半正定 矩阵. 但是 • 关于 Hadamard 绝对值矩阵丨/\丨=[丨化| ], 

其结果乂如何呢？ （ a ) 假定 A 6 M ■是正定 矩阵. 对”=1, 2, 3,利用行列式准则 （7. 2. 5) 直接 
证明丨 A | 是正定矩阵.试用取极限的办法对半正定矩阵 A (仅当” =1, 2, 3时）得到相应的 
结果. （ b ) 利用 /( hcosQ ) 是正定函数的努实[或把 cos ( _ r ) 写成 cos ( j 0 y +< f - u >/2 然后计 
W 二次型]证明，对 U ]， 乃，…， •/■•}(=!< 的所有选择和所有《=1, 2，…，矩阵 A = [ COS (: r , 

— A )] 是半正定 矩阵. （ c ) 设 n = 4, R 设 j *,=0, x 2 = tt /4, j 3 = 7 t /2, 和 a =3 tt /4. 在这种情 
形，直接计算 （ b ) 中的（一定是半正定的）矩阵并且得出它是 Toenitz 矩阵. 计算丨 A | 和 
dex \ A \ 9 且证明丨 A | 不可能是半正定矩阵. 

5. 考虑习题4中的矩阵 | A 丨 • 证明 ， \ A \ - | A | 是半正定矩阵，而它的非负 
" Hadamard 方根”+是半正定矩阵.将这与普通方根 ZT 2 的情形作一比较. 

6. 考虑用 


10 3 -2 1 

3 10 0 9 

-2 0 10 4 

19 4 10 - 


给出的矩阵 A 6 M ,. 证明 A 是半正定矩阵但丨 A 丨不是半正定矩阵. 


7. 设 KU ， ： y ) 是有限区间 [ a ，6] 上的连续积 分核. 证明尺（1，： y ) 是半正定核当且仅当对 
点集匚 [ a ，6] 的所有选择和所有 7 i = l , 2, — ,矩阵 [ KU ,， 是半正定矩阵. 
提示： 为了证明矩阵条件是充分的，考虑对积分的 Riemami 和逼近 
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J | Kix^y)f(x)f(y)<irdy = ^ Kix, ,jt, ) )Aj, 

为了证明矩阵条件是必要的，考虑函数 ； 

n 

462] fix ) = X ,) 

• -I 

其中氏 （* r ) 是“近似谷函数” • 它是连续的，和非负的，在区间[一 e , e ] 外恒为零， ft 适合 

J S t (x)ds = 1« 

然后让 e -0. < 

8. 试用习 k 7和 Schui ■乘积定理证明半正定积分核的（逐 点） 乘积是半正定的.这个证明方 
法是比较基本的，它不窬要积分方程理 b 中的 Mercer 定理. 

9. 证明，函数多 ec ( R > 是正定闲数 L (7.1> 竹习题 8 J 当且仅当 / C (* r , 一: V )是半正 

定积分核. 

10. 证明，两个正定函数 M * r ) 的枳是正定函数. 

11. 说明为什么所有函数 

(a) sin (7>) = r > o . 

( b ) 〆 = 

( c ) 々， = 士 J 

以及它们彼此间的所冇乘积都足正定函数. 

12. 利用 11( c ) 给出 （7. 2>节习题12中的矩阵是正定矩阵的另一个 证明. 

13. 如果 A = [〜]是半正定矩阵 • 证明矩阵 [“，/(/ + )>] 也是 f - 正定 矩阵.提示： 
(7. 1>节习理 17. 

•设 A 6 M " 是半正定 矩阵. 证明，适合 t * A*t = 0 当且仅当 Ar = 0. 如果 A 仅仅 
是 Hermite 矩阵，用例子说明可能有 • .41 = 0 而 Aj •关 0 . 提示： 将 A 写成 A = CMC /*， 于是 
，= 0当且仅当 2 A , U . | 2 =0，其中: r = L />. 

15.( 顶点在原点0 的） 凸锥是这样一个凸集 . S , 使得射线彳彳^ ■: A >0} C = S 对所有都成 
_ 立. 凸锥 S 的一条射线 Uh 是一条极射线，是指若对于 0< a < l 和有1=«夕+- 

( l _ ak 仅当^和 z 都在该射线上，等价地，凸锥的一条射线是一条极射线，是指把它从该锥 
中删掉后所得到的锥还是 凸的. 证明， Mi 中由半正定矩阵组成的凸锥中的射线{^ : 是 

一条极射线当 R 仅当 A 的秩为 1. 于是定理 （7.5.2) 是说，每一个半正定矩阵是位干极射线上 
的诸矩阵的一个凸 组合.提示： （ a > 如果 I 6 C " 是非零的，且 = a A + ( l _ a > B 对某个 
(0，1>以及半正定矩阵 A , 成立，设 U , 是一个适合 j ••心 =0( 其中务 =. 

2，…，幻的标准 IF •交 组. 于是因而根据习题14每个 《 r * 在 A 和 B 的零 
空 间中. 由此得出， A 和 B 的秩都是1,并且各 Q 都是 ir •的一个正纯量倍数 •（ b > 如果 
M " 是半正定的，且其秩々>2，利用定理 （7.5.2 )&A = B + C ， 其中 B = ^0, rank 
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1,且 Ct ； = 0. 由此得出， C 不是 B 的一个纯 M 倍数，因而 A 不在极射线上. 

7.6 相合： 乘积和同时对角化 


与正实数的乘法不同，普通的矩阵乘法不总保持正定性.两个 Hermhe 矩阵的乘积甚至可 
以不是 Hermite 矩阵（只有当它们可交换时，乘积才是 Hermite 矩 阵）， R 乘积诱导的二次型可 
以不是非负的.我们特别把这一节的重点放在正定矩阵上；关于 Hermite 矩阵的更一般的结果 
见 （4. 5) 节. 


• 6.1 例 设>\=[ 2 H 和 一忖:]， A 和 是正矩定阵•但 8 

— 2 1 」 LI 1 L 一 3 一 


不是对 


称矩阵， H ( AH ) 


•8 0 - 
■0 _ 1 - 


甚至连正定矩阵都不是. 


但是，正定矩阵的普通乘积至少还保留了一点正件.我们的讨论要说明某些涉及矩阵的和 
与积的有用技巧. 


7.6.2 定义我们知道，两个矩阵 A , £3•相合，是指存在非奇异矩阵 CeM „ 使得 

注意，和相似一样，•相合是等价 关系. 冇时在复的悄形采用术语共統相合，以便把它和实 
相合区別幵来. 


7.6.3 定理正定矩阵 A 6 M ” 与 Hermite 矩阵的乘积是可对角化矩阵，它的所有特征 
值都是 实数. 矩阵 A /; 与 Zi 有相问数□的正特征值，负特征值和芩特 征值. 此外，任意只具有 
实特征值的可对角化矩阵是-个正定矩阵与一个 Hermite 矩阵的乘积. 

证明： 对于前一部分，注意到于是后一个矩阵相似于 AB , 因 
而与它恰好有相同的特征值. W 为 A l / Z 是 Hermite 矩阵，所以矩阵 A l /2 / i / V /2 相合于因此， 
根据 Sylvester 惯性定理 （4. 5. 8)，/3的特征值与/\的 • 因而与的特征值有相同的符 
号集.此外， W 为是 Hermite 矩阵，它可对 角化. 因而 AS 也一定可对 角化. 关于 
后一个 论断， 假定 C 6 M •是可对角化矩阵， M 只有实特征值： C = SDS 、 ， 其中 D 是实对角 
矩阵.则 C := S ( S ， S _ 其中 A = •是正定矩阵而 Be 

vS 1 ' DS 1 是 Hermite 矩阵. 口 

两个矩阵可经相似同时对角化是不常有的，需要较强的附加条件：交 换件. 但是，两个 
Hermite 矩阵可经共同的•相合同时对角化所需要的假设条件就 很弱. 经 •相 合同时对角化对应 
于用诸变贵的一个线件变换把两个 Hermit 二次型变换成诸平方项的线性组合 • 下面的结果是 
经典的；关于综合的结果见 （4. 5. 15). 

7.6.4 定理设 A ， SeM ” 是两个 Hermite 矩阵，且假定存在 A 和 B 的一个实线性组合可以 
是正定矩阵，则存在非夺异矩阵 C 6 M , 使得 (：• AC 和 CTBC ； 都是对角 矩阵. 

证明： 假定对某个 a ，#6 R ， 是正定矩阵. tr 和沒中至少有一个必定非零，所 
以可以假定_0.但是，因为 VP — a A )， 如果能证明 A 和 P 可经•相合同时对对角化， 
则可以得出， A 和 B 也可经•相合同时对 角化. 由（7.2.7> 可知， P •.相合于单位矩阵，即存在 
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某个非奇异矩阵 GeiVt 使得 CrPC ,= J . 因为 CrAC , 是 Hennhe 矩阵，所以存在酉矩阵 U 
使得 [/•(：,• AC , L / = D 是对角矩阵.令 CeC ' L /， 则有 C •尸 C =/ 和 c - ac = d ， 并且 cr BO 
U — a D ) 是对角 矩阵. □ 

这个结果最常见的应用是针对力学中的经典情形的，其中，两个实对称二次型是给定的 a 
有一个是正定的. 

7. 6.5 推论如果是正定矩阵 • 且 BeM 是 Hermite 矩阵，则存在非奇异矩阵, 
使得 C • B C 是对_矩阵且 C • A C ： . 

练习试求诸变#的一个变换使得两个二次型5/— 2/ jy + y 和— /都是平方项 
的加权和. 

对于一个是正定矩阵，另一个是 （复） 对称矩阵的矩阵偶，也有类似的结果.这个结果也可 
以归并到 （4. 5. 15) 中. 

7- 6.6 定理如果 AeM _ 是正定矩阵 • 且《6^ 是复对 称矩阵 • 则存在一个非奇异矩阵 C 使 
得 (T AC m ' T BC 都是对角 矩阵. 

证明： 我们选取非奇异矩阵 C , eM •使得 C :, •々(：,=/•于是是对称矩阵，因而根据 
Takagi 分解（4.4. 4>，存在两矩阵 LM 史得 【厂 （ CrBC , > U = D , 其中 D 是对角矩阵.于是也有 
U ^ C ； AQU = I , 这样，可以取以. □ 

这个结果可应用于®变函 数论； 关于单叶函数的 Grunsky 不等式是由正定 Hermite 矩阵 
和 S 对称矩阵所诱导的二次型之间的不等式. 

下面的结果是 （7. 6. 5) 的直接应用 • 

7.6.7 定理函数 /( A ) = log det A 是 A 中正定 Hermite 矩阵组成的凸集上的严格凹 函数. 
证明：对任意两个给定的正定矩阵 A , B 6 M ,. 必须证明， 

/(oA + ( 1 - a)B) ^ a /( A )- f(l -a)f(B) (7. 6.8) 

对所有 fl e (0, 1>成立，而其中等式成立当且仅当 A == B . 利用 （7.6.5) 写出 A = C / C •和 B = 
CAC ， * 其中，是某个非夺异 矩阵 ， A = diag ( A ,, — , A J • 且所有 A ,>0. 于是， 

/( aA-f (l - a ) B )= /( C [ a /4-( l - a ) A ] C - ) = /( CC _ ) + /( a / + (1 - a ) A ) 

= /⑷十 /(a/ + (l-a)A), 

且 

af(A) -f (1 -a)/(B)= af(A) + (\- a )f(CAC m ) 

= a /( A)-f ( l - a )[/( CC - )4-/( A )] 

= a /( A ) (1 — a )/( A ) -f (1 — a ) f ( A ) 

=/( A ) + ( l - a )/( y \). 

因此只需证明，对所有 a e (0, 1>， /( a/+(l — a ) y \»( l — a )/0\) 对具有正对角元的任意对角 
矩阵 A 成立.但这容易从对数函数本身的严格凹性推出，因为 

/(aJ + (l-a)A)= log XJ[a+ (1 -a)A ,]= 公 log [a+(l- a )A,] 

<=i I 
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彡 Stalog 1 -f ( l- ff )log Aj 

—l 

w m 

=(1 — a ) A . = (1 — a)log JJa , 

i -1 i -1 

=(1 — a)log det = (1 — a ) f ( A ). 

这个不等式中的等式成立，当且仅当每个 A , = 1， rfn 这能成立当且仅当厶=/且13 = 17(^ = A . 

□ 

定理 （7. 6. 7) 常常采用下述形式，它是对不等式 （7. 6. 8) 取幕得到的，它对正定矩阵的凸组 
合是正定矩阵 • 因而一定是非奇异矩阵的事实给出 了数域 表示. 

7.6.9 推论设 A , A ! 是正定矩阵，且设 0< a < l .则 

det[aA + < 1 — a )6] ^ [det A]°[det B ] 1 - * 

其中等式成立当且仅当 A = B . 

习题 

1. 假定 A 6 R 适合 /T 其中■是正定 矩阵. 证明 A 可对角化且 A 的所有 

特征值都是 实数.提示： 考虑 AS = SA ' 证明 AS 是 Hermite 矩阵，然后利用 （7. 6. 3). [467 

2. 证明 /( A ) = tr A 1 是关于正定矩阵的严格凸函数. 提示： （7.6.7) 的证明. 

3. 如果 A 6 H . 是半正定矩阵，如何推广 （7. 6.3)? 证明，的特征值还是实数 ， R AB 
的正特征值和负特征值不会比 B 的多，不过它可能有更多的零特征值. 

4. 如果不是 Hermite 矩阵， （7. 6. 3) 可以推广到什么程度？ 

5. 试用例子说明，吋能两个 Hermhe 矩阵可经相合同时对角化，但它们不满足 （7. 6. 4) 的 
假设条件. 

6. 设 A ， 是给定的 Hermite 坧阵.就 A 和 B 的特征值而论，/的两个特征值的 
实部的所有可能符号是什么？你能把它推广到吗？ 

7. 设 A ， i 3€ M n 是 Hermite 矩阵 ， M A 是正定 矩阵. 试用（7.6.5> 证明 ， A + B 是正定矩 

阵，当且仅当 A l 的每个特征值大于一 1. 提示 ： A + + 

8 - 设是 Hermite 矩阵，将 H 写成 H=A + iB ， 其中 A , BeM ,( R ). 验证 A 是对 
称矩阵而是斜对称矩阵，因而 B 的特征值是纯虚的，且成共轭对 出现. 试证 H 是正定矩阵 
当且仅当 A 是正定矩阵且的每个特征值大于 一1. 提示：利用 ， Hx =， A * r 对所有 
• r €! T 成立的 事实. 利用习题 7. 如果 A 是正定矩阵，证明，如果 A 是的特征值，则一 
A 亦是它的特 征值. 由此得出， H 是正定矩阵，当且仅当 A 是正定矩阵且,的每个特征 
值位于区间（-1，1>内，并 El 的特征值成对卜 A , 出现.由此得出 0< det : H < 

1,因而 detfi < detA ， 这是 H . P . Robertson 的不 等式. 现在记 f / = A +，B = A (/ + !A 1 ， 

然后证明，如果 H 是正定矩阵，则 det H = det Adet (/ + !7\ - l i 3 )&(XdetU + iA iBXl •由 
此 得出， 如果 H 是正定矩阵，则 detH < detA ， 这是 0. Taussky 的不 等式. 

9. 由定理 （4. 1.7>可知，矩阵是两个 Hermite 矩阵的 乘积， 当且仅当 A 相似于实 
矩阵.试用 （7. 6. 3) 证明， A 6 M ” 是两个正定的 Hermite 矩阵的乘积，当且仅当 A 可对角化且 
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_ 只有正特征值. 提示： 关于逆命题 • 考虑\ 

10. 如果 A ， B 6 M b 是正定矩阵，则我们知道，乘积 AB 是正定矩阵当 a 仅当是 
Hermhe 矩阵.证明相同的结论对三个正定矩阵的乘积也 成立； 也就是说，如果 A , B ， （:6 
艏〃是正定矩阵，则乘积 S = ABC ： 是正定矩阵 • 当且仅当它是 Hermite 矩阵. 提示： 记 S = 
(AB)C=EC, 根据习题 9. 其中£:有；！个正特征值.利用 （7. 6.3) 证明，如果 . S 是 Hermite 矩 
阵，则 EsSCT 1 与 S 有相同数目的正特征值. 

11. 对习题〗0中的结果的下述另一个证明作详细的 论述： 设 S ( a ) E [( l - a ) C 十 aA ] BC ， 
其中 0< a < l . 如果 S ( l ) 是 Hennite 矩阵，乂因为 S (0) = CBC 自然是 Hermite 矩阵，所以所 
有 S ( a ) 都是 Hermite 矩阵. 证明所有 S ( a > 都是非奇异的， W 为 （ 1 一 + 是非奇异的. 

的诸特征值连续地依赖 a , 当(!==0时所有特征值是正的，因为所有 S ( a > 是非奇异的，故 
它无零特征值.由此得出 S ( l ) 的所有特征值是正的. 

进一步阅读关于取 A 各种正定类的矩阵所作乘积的其他结果，以及关于多个正定矩阵之 
积的较早结果，其有关的资料可参看 C . S . Ballantine and C . R . Johnson 4 *Accretive Matrix 
Products , M Li «. Multilin. Alg. 3(1975)，169-185. 

7.7 半正定次序关系 

因为 Hennite 矩阵是实数的推广，而正定 W 阵是正实数的推广， A 然耍问，在 Ilermhc 矩 
阵类中是否有不等式关系或（偏）序关系的适当槪念. 

7.7.1 定义设 A ， BeM ” 是 Hermite 矩阵.如果 A — B 是半正定矩阵，我们就用表 
示，类似地表示 A - B 是正定 矩阵. 

练习证明上述的不等槪念与矩阵的相等溉念是一致的，即证明和绝涵 A 

=B. 

练习证明，关系 > 是传递的和自反的，但它不是全序：即存在 Hennite 矩阵 B 6 M „ 
_ 使得和都不 成立. 这样的关系称为偏序. 

实线性空间上的偏序常常定义 如下： 确定某个特殊的闭凸锥，并 R 说一个元素大于或等于 
另一个元素，是指它们的差位于这个特殊的 锥中. 在这种情形， Hemiite 矩阵的集合是 
实线性空间，而半正定矩阵的集合是闭 凸锥. 这 M 然是 R 自身为实线性空间而非负实数集为 
闭凸锥这一熟知情形的 推广. 不过在 R 上给出的是“膂通”的 （全〉 序（而不仅仅是偏序）. 

矩阵间的各种其他的“不等”槪念（其中最值得注意的是按照分最确定实矩阵的 大小） 可以用 
类似的方法来 定义： 把矩阵的一个锥看作非负实数的推广，并且说大于或等于” B ， 是指它 
们的差 A — B 位于这个锥中.一般，这样一些不间的“不等”槪念可以通过上下文来区別，不过 
它们的效用取决于与实数集的类似推广到什么程度以及这个“不等”槪念与其他不等关系 （例如 
特征值、行列式等之间的不等关系）有多么密切的关系. 

注意， A 是半正定矩阵，当且仅当而 .4 是正定矩阵，当且仅当 A >0, 其中0 是与 
A 同阶的零矩阵. 

练习用例子说明半正定偏序关系在下述情形与实数的全序关系 不同： 如果且 A 不 
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等于 B ， 则得不出 A > B . 

下面，说明半正定次序关系的某些性®，其中每一个可以看作实数的普通次序关系的推 
广.其类似程度一般是很强的. 

7. 7.2 论断如果 A ， 是 Hermite 矩阵，贝 IJ 

A > B 蕴涵 丁. 8丁 

对所有： 成立； 如果且 TtMu 有秩// I ,则还有 

A > B 蕴涵 T-AT > T * BT . 

证明： 如果 A — B 是半正定矩阵，则: y*(A — £3>： y >0 对所有 成立. 

于是，（了-八了一 了_丑了)1=( TV ) •(△ — «)( 7>»0对所有成立，而这表示 T - AT - 
是半正定矩阵， w 此7-/\7>7^£^.注意，这推广了 （7. 1.6)，而其证明本质上是相 
同的 • □ _ 

练习验证上述第二个论断以完成证明. 

7.7.3 定理设 A ， ■是 Hermite 矩阵，乂假定 A 是正定矩阵 & H 是半的定矩阵•则 
当且仅当 〆 *)<1,而当且仅当 〆 BA ' XI . 

证明： 根据（7.6.5>,可以求出非奇沣矩阵 C 6 M " 使得 A =(:/ C •和 B = ，其中 D = 

diag ( J ,, d , % .... 是对角矩阵.干是当 FI 仅当 C [/ 一 D ] C * >0，这乂当11仅当乂 <1 
对所有/=1，2，… 成立. 但是 W 为 iM X =CDC \ 所以 ZM - 1 的特征值正 

奸&山， d 2 ，…， A [根据(7.6.3> 它们都是非负的],且所有当且 仅肖 〆 BAKI . 仔 
细分析刚用过的耶些不等式便可得出后一个论断. □ 

7.7.4 推论如果 A ， 是正定矩阵，则 
( a ) A>B 当 R 仅当 B *>A '； 

< b ) 如果 则 det A>det Bflxr A>xr B ； 

( c > 更一般地，如果 A 和 B 的各相应特征值按冏一 （递 增或递 减） 顺序排列， 

A *(«) 对所有々=1，2,…，"成立. 

证明： 我们知道当旦仅当 〆 ' XI . 但 是 〆 D ，7. 3) 说明 
P (A W ><1 当且仅当 B 1 >A 如果/\>«，则 〆 iM 1 )<1, 乂由 （7.6.3) 可知， 

所有特征值是非负的，所以得知它们必定位于 K 间（0， 1] 内. 另一方面，它们的乘积至多为 
1，所以 ckt(BA ，因而 det .4 >det 在 （7. 7.3) 的证明中，已知 A = CT •和 B = 

CDC •’ 其中 C =0"]6 M n , D = diag ( d , ，义，，… • 乂 > 6 M ” ，且对所有，=1，2，…，《， 
0«<1.不难算出， 


n 

tr-A = tr Cr- = 2 I r v I 2 , 

“， =1 



且 


tr B 


tr CDC - 
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m \ 


< 2 ' c *> i 2 = ir A - 

最后一个论断（它蕴涵行列式不等式和迹不等式，对此，我们已经给出了两个无关的证明）可直 
接从 Hermite 矩阵的有序特征值的 Courant-Fischer 变分特征推出，并且包括在推论 （ 4. 3. 3 ) 
中. □ 

练习如果 A > B >0, 证明 det A>det B 和 tr A>tr B . 

当把关于分块矩阵的逆的形式 (0.7. 3) 限制到 Hermite 矩阵的情形时，便得出下述有用的 
公式： 


r a Br' _ r (A- dc~ 1 b- r l a 1 bcb- a-'b-o 
Lb- c 」 _ Lor a — cr 1 it a— (C-b u A~ l Br l 

在这个公式中，假定 A 和 C 是方阵且需求逆的矩阵是非奇异的. 

_ _ r A .r A BT l . 


(7. 7.5) 


如果矩阵 


■A B ' 

•ir (:- 


是正定矩阵 


, m A B 

IB - cJ 


存在且为正定矩阵.于是从 （7.7.5) 和 


<7. 1.2) 推出 （A — «，•《• > 1 和 A — BCW 是正定 矩阵. 类似地 • C - B ' A ] B , A 和 C 是正 
定矩阵. 因此， 如果分块 Hermite 轵阵^ 是正定的，则有 

A > 0, C > 0, 仪 ： W 和0 B - 


7. 7.6 定理假定一个 Hermite 矩阵块分成 


㈡ , 


其中 a 和 C & 方阵. 这个矩阵是正定的当 ii 仅当 a 是正定矩阵 nc>ir a 此外，这个条 

件等价于一定有 〆 /r a i bc - | )< i . 

证明： 这两个条件的必要件已在上面做了 论述. 关于充分性，假定 A 是 IF 定矩阵且厂> 
B - 对久=一八-丨3,算出 

[;n c _ 二 j ， 


因为右边是正定矩阵，所以 


- A B - 
-B* C. 


的正定性可从所给出的相合及 （7. 1.6) 或 （7. 7. 2) 推出. 把 （7. 7. 3>应用于不等式 OB ' A' l B 
便得到后一个论断. □ 

A B 1 

练习如果 L b . ( , J >0 - 证明 det C>det IT A W 和 det A〉det BC — ifT . 当 
时，这说明什么？证明，如果£3是方阵，则 det Adet O | detB 丨 2 . 

练习假定 A 6 R ， CXR 和肝又假定 A 和 C 都是正定矩阵.证明 B l >0 

Lb- c 」 



当且仅当〆 f A- ’BC *><1. 

(7. 7. 6) 中的分块正定矩阵与出现在复变函数和调和分析中的某些双线性不等式有关，这 
些不等式都具有正定偏序的某些性质. 

7.7.7 定理设*(：€“,，是正定矩阵，且设则下列条件 等价： 

U )(， A :)( yC » | x - By \ 2 对所有 和所有 成立； 

ib)x' Ax^-y' Cy>2 I x * B3 , | 对所有 iGCT 和所有 y6CT 成立; 

(c)p(B-A-'BC 'XI ； 

r a bi 


A Bl 
- B * CJ ' 


证明： 我们来证明，蕴涵 （ b >, ( b ) 蕴涵 （ c ), ( c > 殖涵 （ a ) ; 已经知道 （ c ) 和 （ d ) 是等价 
的. 如果 U ) 成立，则由算术一几何平均值不等式有 

jU-Ax+y-Cy )^： U' Ar) l/i (y-Cy) m jc'B y \ 9 

所以 （ b ) 成立.如果假定 （ b > 成立，则 

+ + ( C l 2 ： y )>2 \x' By\ 9 因而对每个 和 

每个: yeC ” 有 

〆 I 十: y ■: V 彡 2 I BU ： l /2 y ) 1=2 1 s ' A ' l/2 BC 1/2 y |. 

如果在这个不等式中令 x^A l / t BC - l ,2 y , 便得 

， C l/2 irA^BC l ， 2 y^y' y>2\ y' C m H^A x ^ x,t y\. 

因为矩阵 c •正定的，这等价于对所有: yec •有 

y-y^yT l，t ir A- l BC l,2 y. 

如果选取 y 为 ( T l/2 fT A 1/2 的特征向 fi , 这个不等式说明，（一定非负）的相应特征值不 

大于】，于是得知谱半径至多 是丨； 即 1^7( C ； l/z /r A x BC m )^ p { B - AVBC - X ), 因而 ( c ) 成 
立.最后，如果 （ cO 成立，则对任意和 任意: 有 _ 

I J -* ( A - l /2 BC - U 2 y ) | 2 < IUIH || A - m BC ~ m y \\\ 

= <， x){y-C 1/2 B- A^BC ： y )， 

其中 IU II 卢 o •，是 Euclid 范数. 如果我们现在作代换•和 y-*C x,2 y y 则对所有 
j - ec 和所有 yec ”， 有 

I J： m By I 2 < (x m ArHy-Cy). □ 

对于由 （7. 7.5) 产生的另一种不等式，我们考虑能应用于正定矩阵的两种可能运算 ：基于 
指定的指标集选定主子矩阵与求矩阵的逆.我们知道这两种运算保持正定性，但是按两种可能 
的顺序实施这两运算的结果之间存在什么关系呢？研究结果表明，这两种 运算“ 除了相 差一个 
不等关系以外是可交换的”. 

7.7.8 定理假定是正定矩阵，且设 SCZU ， 2,…，是一个指标集，则 

P '( S ) > [ PCS )]-*, 
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其中，这个不等式左边是划去 P 1 的标号为 S 的诸行和诸列后所确定的的主子矩阵，而右 
边是 P 的相应主子矩阵的逆. 

证明： 因为正定矩阵的集合在拽换相合下封闭，我们可以假定 

A Bn 

P = 

Lir c 」 

及 于是 ) ••且 [尸 （ S )] -1 = A ' 由于 C >0( 这是因为 

0)，所以有 ’IT >0和 

A > A - BC x B m > 0. 

于是所断言的不等式可由 （7. 7. 推出. □ 

定理 （7. 7. 8) 可以解释为“一个正定矩阵的主子矩阵的逆小于或等于该矩阵的逆的相应主 f 
矩阵•” 

(7. 7.8〉的一个应用是从矩阵的 Kronecker 乘枳中特殊选择一个主子矩阵来产生其 
Hadamard 乘积. 如果 A , B 6 M n , 乂如果 《 S = U , « + 2，2« + 3, 3” + 4,…， n 2 ) ,则 A 。/3 
-( A ®«)( S ). 若 A 和 B 可逆，则可逆且 M ®«) 因此，如果 A 和 B 

是正定矩阵 &把 （7.7. 8>用于 P = A ® B , 则 A * - H , = ( A- | ®B , )( S ) = ( A ® B )* , ( S )> 
LM ® ⑴ （ S )] i = ( A 。 ⑴如果取这说明 A 1 ◊ AiXA 。»• 但是，如果取 
H = /\ 、这便说明，当 A 是正定矩阵时， A 1 o A>(A . A . • A) -\ 

这后一个不等式说明 • A 1 • A 优于它 A 己 的逆. 关 f A 1 。 A , 这指的是什么？如果 C 
是正定矩阵， H . C = UAU ' , /\ = diag ( A ,, AJ , 其中所有 A ,>0, 则 OCT 1 当且仅当 
1， m \ oi > c ^. 我们把这些结论总结为 

7. 7.9 定理设 A , 是正定矩阵，则 • 1 

(aM • 。 ZTXA 。 »)■'； 

( b ) A 1 。 A l >(A • ••: 

( CM -1 。 A > l >{ A~ x • A )' 1 . 

W 为/\ x A = l , 所以 （ c ) 的前一部分说明/\ iA ; 即在这种情形， Hdamard 乘法 
优于普通乘法. 

习题 

1. — 般，设月€ M ” 是 Herniite 矩阵 • E .4 > B ,证明，如果 Ai 是 A 的 

有序特征值， S 〜是《的有序特征值，则1 =，2,…， ；!. 但是用例子 
说明逆命题不总是成立的. 

2. 如果 A ,， A 2 ， B |， B 2 6 都是 Hermite 矩阵，证明，如果 且 A 2 > B 2 ， 则 

a , h - a 2 > b ,+ b 2 . 

3. 设 A , B ， CeM ” 是 Hermite 矩阵； 假定 和 C >0. 证明 A 。。 C . 

4. 设/ B ， C ， 是 Hermite 矩阵，且假定和 C > D >0. 利用前一个习 
题证明 A 。。 D >0. 

5 - 如果 A ， 136 M " 是使得 A 的 Hermite 矩阵，乂如果 J 匚彳1，2，…，幻是任意指标 
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集，证明 

6. 说明 （7. 7. 6) 推广了 ； i = 2 时的 （7. 2.5). 

7. 如果 (7. 7.6) 说的是什么？如何为一个正定矩阵增添一行和一列且仍保持正 

定性？ [475 

8. 证明， （7. 7.8) 的不等式是严格的，当且仅当 S ') 有满行秩，而当 P ( S , S 、=0 
时恰好等式 成立. 这电，尸 ( S , S '〉 是从尸中划去标5为 S 的诸行和标号为 S ' 的诸列后得到的 
P 的子矩阵. 提示： 证明 rankR US ) —尸 （ S 厂 Jsrank 尸 ( S , S '). 

9. 如果八6吣是 Hermite 矩阵 • 证明 A 当且仅当 A 的所有特征值小于或等于 1. 

10. 试用 （7.7.7) 给出（7.4> 节习题 丨1 的另一个解法. 提示： 证明，若 B >0, 则 
[B I 1 

L ； B ->° - 

11•考虑 A = C 时的 （7. 7.7). 证明下列条件 等价： 

Ax )( y - Ay )^ \ x ' By \ z 对所有 v 6 C 成立； 

{ b ) x - I x-By | 2 对所有 h X 6 C 成立： 

' Xl , 

( ci ) I x - Bj - I 对所有 成立. 

12. 证明，如果 A 6 M „ 是可逆对称矩阵，则 AA 的所冇行和等于 1. 提示： 考察 A -1 
各元的代数余 子式. 这样，如果 A 是实正定矩阵，证明，即使 A 、 A >/， 也不会有 A ，。八 
>/. 

13. 如果/ V *’表示/\的 Hadamard 々次幂，乂如果/\ 6 是正定矩阵，证明 （A 1 ) (i, > 

( A tk) ) 1 对所有々 = 1, 2,… 成立. 

进一步阅读关于（7.7.7>的背景材料以及其他资料 SJ 参 SC . FitzGerald and R . Horn . 

“On tlie Structure of Hermitian-Symmetric Inequalities ,** J . London Math . Soc . 15(2) 
(1997〉，419-430. 与 （7.7.8)，（ 7. 7. 9 > 有关的其他资料也可参矜 C Johnson , 41 Partitioned 
and Hadamard Product Matrix Inequalities ，” 人 Research NBS 83(1978), 585-591. 

7.8 关于正定矩阵的不等式 


K 面，要讨论这样一些不等式，它们所涉及的楗与•个或多个正定矩阵相 关联. 这些不等 
式与上一节 所介绍 的不等式是有 K 別的，尽管乂•于前者的一些例子与关于后者的一些例子常常 
是有联 系的. 例如，蕴涵 det A > detB . 正定矩阵有一些涉及行列式，特征值和其他 
蜻的不等式. 在这一节，我们考察某些不等式，它们不一定来自矩阵不 等式. 

关于正定矩阵的基本行列式不等式是 Hadamard 不 等式. 许多其他的不等式用不同的方式 
推广了这一结果. 

7.8.1 定理 （ Hadamard 不等式）如果 A = [义 , ]e 是半正定矩阵，则 

fv 

det A < J \ a B . 
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477 


此外，如果 A 是正定矩阵，则等式成立当且仅当 A 是对角矩阵. 

证明： 如果 A 是奇异矩阵，就没有什么可证的，因此假定 A 是非奇异矩阵且它的所有心 
关 0. 定义乂 且设 D = diag ( A ， …， d „). 因为 detDAD < l 当且仅当 det 
化…、， 所以只要假定 A 的每个对角元等于1就可 以了. 如果 A , ，…，是 A 的（必定为正 
的）特征值，则有 

det A = . < ( 墙 ，)、(X = 1 

这个不等式可从关于非负实数的算术一几何 f 均值不等式 推出. 算术一几何平均值不等式中等 
式成立当且仅当所有 A , = l , 但是，因为 A 是 Hermite 矩阵，因而可对角化，所以，这种情况 
能出现，当且仅当八=/.因此，当 A 是正定矩阵时，在原不等式中等式成立当且仅当 A 是对 
角矩阵. □ 

关于一般方阵的另一个行列式不等式等价于 （7.8. 1), 它也叫做 Hadamard 不等式.几何 
上丨 det A | 是”维平行八面体的体积，它的各生成边是由 A 的各行（或各列）给出的.当各生 
成边相互正交时，这个体积最大，而这时其体积是各边长的 乘积. Hadamard 不等式是这个儿 
何不等式的代数描述. 

7. 8.2 推论 （ Hadanwd 不等式）对于任意矩:阵《 = ，有 

NetB|< II(S |6 V |*) I/2 

— ,-1 

和 

I det fl ( E I K \ 2 ) m . 

此外，等式成立当且仅当 b 的各行（相应地 ! 相互正交. 

证明： 如果 B 足奇异矩阵，那就没有什么要证的.如果 Z 3 是非奇异矩阵，把 （7.8.1) 成用 
正定矩然后取方根.第一个不等式右边是 A 的各对角元的乘积的方根，而左边 
是 detA 的 方根. 当 A 释对角矩阵时，即在 （7. 8.1) 中等式成立的情形恰好 fi 的各行互相正交. 
把第一个不等式应用于便可推出第二个不等式. □ 

练习我们已经从 （7.8. 1>推导出（7.8.2>.现在证明 （7.8.1) 可由 （7.8.2) 推出. 提 示：如 
果 A 是正定矩阵，则存在唯一的正定矩阵 B 使 B 2 = /\. 把 （7. 8.2) 应用于 S 和它的 平方. 

练习你能利用 Hadamard 不等式（及其变形）给出 

•111 
det 1 一 1 _ 1 
• 1-1 1 . 

的最大界吗？ 

对关于正定矩阵的 Hadamard 不等式作出改进的两个推广应归功于 Fischer 和 Szasz •在 
Fischer 不等式中，互余主子矩阵所起的作用相当于对角元在 Hadamard 不等式中所起的作用. 

7. 8.3 定理 （ Fischer 不等式）假定 

P=「“] 

L/r c 」 




是正定矩阵，其中子块 A 和 C 是非空方阵（参看本节14 题} .则 

det (det AHdetC ) 

证明： 设然后算出 

—[； :] [；• c] [: 

= (det A )( det [ C - B m A 1 B ~]) < (det A)(det C ) 
后一不等式用到了（7.7.6)和（7.7.41)>以确保如1(：彡 ( ^((：一化>\4«),这是因为， OC- 
B a A ~ l B >0. □ 画 

练习试从 Fischer 不等式推导出 Hadamard 不等式 （7.8. 1>. 同时，试对于比（7.8.3> 中 
的分块（两个主子矩阵）要细但乂不如 （7.8. 1>中分块 （ n 个主子 矩阵） 那么细的 P 的分块，提出 
并叙述 Fischer 不等式.注意，在这种情形， Fischer 不等式的右边小于或等于 Hadamard 不等 
式的 右边. 因此，关于加细的各种分块的 FLscher 不等式给出关于 det P 的上界的一个单调不 
减序列. 

存在另一种不等式，它给出关于行列式的一系列上界 • £1包括 Hadamard 上界.设 R ( A ) 

表示 A 的所有々 X 々主子式[共有个]的乘积.我们注意到， P .( A)=det A , rfti P ,(>\) = 


7.8.4 定理 ( Sz asz 不等 式） 如果是正定矩阵，则对所冇 A = l , 2 ,…， w — 1有 

证明： 因为 A — 1 的各对角元正好是 A 的各 （7 i — 1) X (« — 1) 主子式与 det A 之比，把 
(7.8. 1) 直接应用于正定矩阵 / T 1 便推出 

丄 = dW < P -» (A) 

det A A ^ (det AV' 

W 而 

PAA) 19 -' = (det A) rl < P m ,(A). 

对这个不等式的两边取— 1) 次方根便得出 Szasz 不等式组屮 k = n _ l 的 悄形. 余下情形可以 
归纳地导出. 例如，对于々= ”一 2的情形 • 我们把每个 U — l > X ( n _ l > 主子矩阵看作一个起始 
矩阵，然后应用上面的不等式得到 

P^i(A ) r2 < P n 2 (A ) 2 

W 为 A 的每个 U _2) X( w — 2) 主子矩阵作为的某个 （ w —1>父（^|一1)主子矩阵的主子矩阵出 
现 两次. 对两边取 U _1 )U — 2) 次方根得々 = n _2 的情形，而余下的情形可用同样的方式推 
出. □ 

炼习证明 Szasz 不等式蕴涵 Hadamard 不等式 （7. 8. 1 >• 其中等式的情形是什么？ [4791 

7.8.5 论断 设是半正定矩阵，且定义 


a(A) = 


纖滅 A" SJE 娜 : 

0, 否则； 


其中 A , ，是划去 A 的第1行和第1列而得的 A 的（《-1)父（《—]>主子矩阵.设 e M ” 是其 
1. 1元为1，而所有其余元为0的矩阵.则对所有 /< a ( A)，A — ，是半正定矩阵，而对任意 
t > a ( A ), A — / E u 不是半正定 矩阵； 特别是，半正定矩阵. 

证明： 只要考虑 A 是正定阵的情形即可.将 （7. 2. 5) 应用于各“尾随”主子式.注意到 A — 
的前”一 1个尾随主子式与 A 的相同 ， fl det(A —/ E n ) = det A —/ det A ,,. □ 

练习给出 （7.8.5> 的证明细竹. 

练习试用 （7. 8. 5) 归纳证明 Hadamard 不等式 （7. 8. 1 >. 

Hadamard 不等式 （7. 8. 1〉也可以用 Hadamard 乘积叙述为 

爾 

(del 川1 】< dct A 。 

I 

T 述定理是 Oppenheim 的不等式（被 Schur 强化 O , 它说明在上述不等式中单位矩阵的作用 
没有什么特殊的，从而推广了 Hadamard 不等式. 

7. 8.6 定理 （ Oppenheim 不等式）如果 A , 珐半正定矩阵，则 

M 

(dct A ) J [ b H < det A • B . 

• « I 

证明：我们对 w 采用 n 纳法 • 对”==】，结论是明 显的. 如果且对阶数至多为”一】 
的所有矩阵，结论成立，则由 a 纳假设可知 

彎 

[480] (<iet A„ )IJ^ < dct A 

1-2 

其中的记号与 （7.8.5) 中相同， • « n =(A - H )„. 因为 A — ，是半 正定矩阵，由此 

得知 （ A — a E ,,> 。 B 是半正定矩阵，因而 

0 ^ dct ( A ~ aEu ) *> B = (det A • fi ) — (det A ,, « B n ). 

由此可推出 


练习 

进而证明 


dct /! 。 > a/，" det Ah 。 ^ a/»,, (det A u > J| = (det A )\\ b „. 

如果 A , I 36 M , 是正定矩阵，证明， 

(det /\)(det /j) ^ det A 。 Z3 


□ 


(det A)(dct B) < (det ) ]J^ < det ^ B < ]Ja B 
练习如果 A 6 M , 是正定矩阵，证明 det A 。 

—种类型不同的行列式不等式适应于其 ff ( A > 是正定矩阵的非 Hcrmite 矩阵 A . 它可以看 
作关于复数的不等式 | H >丨 Re 幻的推广. 


7.8.7 定理 （ Ostrowski - Taussky ) 如果 AeM •使 H ( A > = (A + /V >/2为 JF •定矩阵，则 

detH(A) det A I. 

等式成立当且仅当 A 是 Hermite 矩阵. 
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证明： 设 S ( A > = ( A -/ V >/2, 因而 A = H ( A > + S ( A ). 于是所要证的不等式可述为 

I det [/+ H ( A )~ , S ( A )] |> 1. 

但是相似于斜 Hermite 矩阵 

HiAr in S ( A ) H ( Ar' /2 f 

W 而它只有纯虚特 征值. 因此只要注意到丨1 + //丨对任意实数/成立就可以了.如果",， 
" 2 ,…，^是 n ( An ( A > 的特征值，则 

I det [/+ H ( A )*' S ( A )] I - II I l + it t \> l . 

另外，等式成立当且仅当所有 C =0, 它等价于 S ( A )==0, 这是 W 为斜 Hermite 矩阵是可对角 
化的. 口 

含有两个正定矩阵之和的重要行列式不等式属于 Minkowski . 它的证明与上述结果类似. 

7.8.8 定理 （ Minkowski 不等式）如果 A , 是正定矩阵，则 

[ det(A + B )]" •彡 (det A) Un (det B ) l/ \ 

证明 •• 注意到所要证的不等式的两边是同次齐次的，用 （det •乘其左边和右边.于 

是，不失一般性，可以假定/\=/, M 必须 itf 明 

如果是 H 的特征值，则所要•证的不等式等价于 

鲰 

卜 I 

只要直接计评不等式两边，然后 用算术 -儿何 f . 均值不等式逐项进行比较便可证明这个不等 
式. □ 

缟习给出（7.8.8> 的证明细节，并且证明等式成立当 ft 仅当 B = 对某个 c >0 成立. 

习题 

1. 不等式（7.8.2>说明，行列式的大小可以用其各行的/ 2 范数的乘积来佔计.试把它同如 
下结果[见（ 6 . IV 节习題 3] 作一 比较： 行列式的大小可以用其各行的 /, 范数的乘积来估计 •几 
何上，这每一个界表示什么？还有其他这样的界吗？试一试 

2. (7.8. 2>的左边在 B 的左西乘法下不变，而 （7.8.1) 的左边在 A 的酉相似卩不变，但是， 
两者的右边都无相应的不 变性. 什么时候两个右边达到极小？什么时候它们达到极大？能用这 
种方式得到较好的界吗？ 

3. 试用 Fischer 不等式验证 Hadamard 不等式 （7.8.2) 的下述分块形式的 推广： 设八= 
[ A ,,] 是分块复矩阵 • 使得每个子块于是 

ldetA|<[Il(S!|A,I) I/ 2 r. 

除 f 这里所采用的谱范数以外，还可以用其他矩阵范数吗？ 

4. 试确定 （7.8.6) 中相等的情形. 

5. 设 A , 是正定矩阵，试证 
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det A 。 B + (del AKdet B ) > (det A ) J [ b a + (det 

•=1 t -1 

说明这强化了 （7.8. 6). 提示： 证明 

a(A ° B) ^ a(A)6n + a(B)au 一 a(A)a(B)« 
然后把它应用于普通的归纳假设. 

6. 证明，可以进一步扩展上一个习题中的不等式得到下述不等式 


det A 。 Z 3+ (det A)(det B ) 


det 。 B n 
(det An )(det B u ) 


n it 

> (det A ) J \ b a +(det B ) + (det A )6 "(det - 1) 





7. 如果有正定 Hermitc 部分 f / = (A + i >/2, R ”〉】， 证明 （7. 8. 7> 中的不等式 
可以强化为 


detH ( A ) - f -| detS ( A ) |^| det A |. 

什么情形下可取等式？ 提示： 你必须证明 

I det[/-f H *(A)S(/\)] I -f| detH(/\)- , S(A) |, 

这等价于有 


证明 


n I i+M^i+n u I 

>••1 /-I 


n 11 +", i 2 = … 

i - 1 >-l >-l 

^ i + ^IT^ + (II/,) 2 ^ (i + n I ^ I ) 2 . 

你可以进一步强化这个不等式吗？注意\所论^的不等式关丁^ 1 数的一个 A 然形式应该是 
U I > | Re 2 | + | Im 2 | ,而所论证的不等式可以看作它的 推广； 证明这个自然不等式不 
成立（因而假定”>1>，由此可见要证的行列式不等式有点出乎意料 之外. 

&如果 A ， 是正定矩阵，证明 det(A + fi)>det A + det 

9. 试用 Minkowski 不等式证明 Fischer 不等式. 提示： 把 Minkowski 不等式应用于两个 
正定矩阵 

[：• c ] - [： - I ； B c ][： U 

10. —个正定矩阵 P 6 M , 可以分解成尸••其 中厂 是只有正对角元的下三角矩阵 
(7.2.9). 试用这一事实证明 Fischer 不等式. 

11 - 设八，是半正定矩阵.如果 A 和 B 是非奇异的，证明 A 。 S 是非奇异的（且是 
正定的）.如果是奇异的，证明 A ， B 至少有一个是奇异的.这与 （7. 5) 节的不等式 ran k 
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A 。 Z 3 <(rank AKrank 有何关系？ 


12. 证明，如果是一个具有实元素的矩阵，且 | 〜 | <1，则 | det A | <3>/3. 

同吋证明这个界是不能达到的. 提示： 

-^-(det A ) - 且 -^-(dei A ) = 0, 

其中焱^是八划去 A 的第 / 行和第）列的行 列式. 如果 A „=0, 则 det A 与 心的值 无关，因而 
〜可取土 1. 如果 A ,》 关0，则当0<〜<1时 ， det A 关尸 〜没有 极值.闲此，在所有〜 =士1 
的给定的约束内 ， I det A 丨达到它的 M 大值.对于 ”==3，只有有限个这样的矩阵.一般地， 

对于 ”>3. 其结果乂如何？如果 A 有复元素.则对解折函数应 用最大 值原理大模 定理〉 证_ 
明，在集合彳 A € M n : 所有 U v 丨 < U 内部 | det A | 不可能有最大值. 

13. 4卩果/\ =「〜 ] 6 且 /C = max { | | } • 试用 Hadamard 不等式证明，| det A | 

W 2 . 

14 •设 A 6 M ” 是正定矩阵，乂设 fl Q / V = U ，…，幻是一个指标集. Fischer 不等式可以 
叙述为 det A<dct A( a )det A ( cZ ). 其中 a '是关于 / V 的补集.这个结果的一个推广常称为 
Hadamard - Fischer 不等式，那就是 




(7. 8. 9) 


它对正定 Hermite 矩阵和所有指标集 a ，/V 成立. 通 常规定 det A (#) = 〗.试仅用 
Fischer 不等式和 （0.8. 4) 中的第二个公式证明 Hadamard Fischer 不 等式.提示： 不失 一般性， 
假定 aU/?=/V， 且把 Fisher 不等式应用于 A x { a \ Jp '). 然后把 (0. 8. 4 >应用于每个 子式. 

15. 利用正定 Hermite 矩阵可以写成 U / R L 是非奇异下三角矩阵的亊实 （7. 2. 9>给出 
Hadamard - Fischer 不等式 （7.8. 9> 的 ff 接证明. 提示： 假定不失— 般性. 假定 
«={1，…，幻和沒={1， …， j ， 々+1然后考虑 A 和 L 的一个对应的 3 X 3 子块. 

16. 设 A 6 M ” 是正定矩奸.试用 Hadamard Fischer 不等式 （7. 8. 9) 证明 


^]det A ({ i “+ 1 M 


det A < 上 


n “” 


i 7 •设/是正定 矩阵. 证明 


det A = min { D V , U，".，tU ec n 是标准正交组 }• 

••=1 

提示： 设 7=0, …且把 （7. 8. 1) 应用于 AV . 

18. 设是正定矩阵，且设 U , ，…， wJCC 1 是标准正 交组. 试用习题17证明， 
<“"•••，是 A 的特征向最 feLUf Aw ，…，0\心}是 A 的相应特征值，当且仅当 

IV 

det A = JJii ； Am ,. 

i=I 

19. 如果是正定矩阵，证明 
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7 i(det A ) 1 - = minUr AB ： B ^ M . 是正定矩阵且 det B = 1). 

提示： 记 A = Uy \ LT , 其中 ， A = diag ( A ,, …， AJ , 所有 A ,>0, 且是酉矩阵，于是 tr 
AB ^ xtMU ' BU ). 然后利用算术一几何平均值不等式和 Hadamard 不等式 （7. 8. 1) 证明 

丄2又冶-> ( ITA^i ) 1 " = (det A JJfe . )* " ^ [det A ] 1 " ， 

W i-l »-l i - I 

且等式可以成 

20. 试用习题 19 中的拟线性化证明 Minkowski 不等式 （7. 8. 8> 

21. 设是半正定矩阵，且把 A 写成分块形式 如下： 



试用 （4. 1) 节习題 15中关于行列式的简化公式和 （7. 2>节习 K 11证明 

det A = ciudet A — x ' (adj A ) j - ^ ( i,|det A . 

试用归纳法和这个不等式给出 Hadamard 不等式 （7. 8. 1) 的另一个证明 • 

进一步阅读关于定理 （7. 8. 7) 的其他信息可参看 A . M . (Xstrowski and (). Taussky , “On 
the Variation of the Determinant of a Positive Definite Matrix, H Proc . Kon . Nederl . Acad . 
Wetensch . Amsterdam , Ser . A , 54 (1951)，383-385. 有一类不等式（当 A 是正定矩阵时）把 
det A 与 A 的其他广义矩阵函数 （见 0.3.2) 联系起来，同时也推广了 Hadamard 不等式 
(7.8.1)，其有关的内？？可参 I . Schur . M 0 ber endliche Gruppen und Hermitesche Formen ，" 
4861 Math . Z . 1 (1918), 184-207. 
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8.0 导引 

假定有个城市 C . 它们之间的人 U 流动情况如下 所述： 对所有|»,每天 
上午8: 00同时从 j 城到 I •城去的流动人口的正常比率是、，）城的流动人口仍留在）城的比 
率是“ w . 因此，如果用〜表示第//丨天，城的人口数，则有第，/!天与第川十]天之间的人口 
分布递归关系 

户 ; 如 "= a, … ， /=1 ，•••，”， m = 0 ，】，•••• 

如采用 A = [〜] 衣示由人 U 流动系数组成的” X W 矩阵，&用表示人 U 分布向 
«，则 

〆 明， "= A/> … ， = AA〆 1 "" =…= A- U p l0> * /w = 0,1,-, 

>1；中 />"” 挞初始人 U 分布向 tt. W 为系数…表示流动人口比申，所以，对每个> =1, 1，…， 

歸 

w ， 有<1，且 ^ 2 a n =】• 

1-1 

为了对城市服务以及资金投人作出切合实际的 K 远规划.行政人员想知道，从现在到遥远 

的将来，总的人口0= ]£/>广将如何分布：即他们想知迫，对大的 m , 的渐近变化过程. 

• -1 

m 是， 因为 〆 所以显然必须考察/ V …的渐近变化过程. 

例如，详细考虑"= 2的情形. W 为“ II +“21 = 1 =“12+“22，如果 i 己 = a 和“1 2 =存，则有[487| 

W 1 一 ° / I, 

L a 1 一 /?」 

我们想知道，对大的/«, A ” 等十什么？如果 AM 可对角化的，则可以迕接计算从计算 A 
的特征值歼 姶： A : = l 和 A , = l — a —庠 W 为 ()<«• %1，所以 A z = l 彡丨 A , 1 =丨1一《 —存|， 

于是有1= U 2 I A 的谱 f •径珐/\的一个特征 值. 另外，除了在《=夕=0的 T •凡情形 

(在这种情形， A 是可约矩阵）以外，我们看到是 .4 的单道特征值. 

. 如果相应的特征向 = (对于1 = 1>和 c = Ll , 一 1] T (对于 A ,), 所 

以在这种情形 A 是可对角化的 R A SAS 其中 

ri 01 vs n ^ , 1 ri n 

•0 l—a —/?」 La — 1 J a + pL a — 沒」 

注意，如果 A 是不可约的，则特征向的分锹是非负的和正的. 

如果 a 和# 不都是1，则 Ui 丨=丨 \- Q - p \ <1, W 而当切― oo 时 Ar —0. 因此，在这种 
悄形，有 

lim A " = S(lim A m )S 1 = s\ l °} s ' 1 = 

"•••• LO 0」 a + 沒 La a 」 


因而平衡人口分布是 
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lim p lm) = 


+ fi 




[：：：]= 




注意，平衡分布完全与初始分布无关.矩阵 A " 趋近于一个极限，这个极限的各列与相应于特 
征值 1( 它是 A 的谱半径）的特征向檄/成正比，而极限人口分布与这同一个特征向 M 成正比. 
对于上面没有处理的两种例外情形不难逐一分析.如果 d = p =0, 则八=/, lim = U 

且 lim 所以极限分布与初始分布不是无关的. 


如果 a = # 士丨，则 A = 


0 


0 . 


且两个城市逐日调换它们的全部人 U . A 的幂+趋近于一个 


极限，并且，如果初始人口分布是不平衡的，则人口分布也无 极限. 但是，在“均值平衡”的意 
义下，它们都可达到一个极限，即 

，皆 d ] 和以，=平 [;]. 

总之，从这个例子得知， p ( A ) = U 并且： 

1. 谱半径 〆 A > = 1 本身是 A 的特征值，而它不只是特征值的绝对值. 

2. 相应于特征值 〆 A ) 的特征向蟥 o •可以取非负分 M , 如果 A 是不可约的，则分 M 是 
正的. 

3. 如果 A 的所有元都是正的，则 〆 A > 是具有严格®大換的单里特 征值. 

4. 如果 A 的所有元是正的，则 lim [/\/>( A )]” 存在，且是秩1矩阵，它的所有列与特征向 

霉•參 

Mi 成正比. 


5. 在所有情形存在. 

实际上这些结论一般对 n ^ 2 是成立的，不过用上面所述的简单而直接的方法不可能分析 
研究一般 情形. 例如，当 n >2 时，即使 A 的所有元素都是正的， A 也不一定可对角化.这就 
需要新的 T . 具，这正是本章的其余部分要阐述的内容. 

习题 

1 . 证明’矩阵 A= [: ;]撕径 1»但是当时无界. 

2. 考虑矩阵 



( a ) 证明， A 2 = l 是 A , 的单重特征值， ^,( A )= A 2 - 1 , 且1〉丨 A , 
分别 是人和 A , T 相应于特征值 A = 1 的特征向 M . ( c ) 直接计算 Ar , m 

化卜去[: n . 


I • ( b ) 证明 

=1, 2 ，…. ( d ) 证明 
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( e > 计算 _ r ： y T , 并作出 说明. （ f ) 如果 c — O , 会出现什么情形？ 提示： 令玖 = ( l + e ) A ,, 然后如 
正文中那样对角化 

3. 从人口 fl 由流动的观点来说明，由城市间的人口流动系数组成的一般矩阵是不可约的 
意味着什么. 

4. 对于在本节中所讨论过的两个城市的例子，试证明，在《==/?=0以及的情形下 

lim ( l / W ) 存在.在每种情形下的极限各是什么？ 

w - '* 卜 I 

进一步 SI 读关于正定矩阵和非负矩阵的性质的丰富信息，以及许多理论与应用的参考文献可 
见 [ BP 1] 和 [ Sen ]. 在 [ Var ] 中，有一个特别注重数值分析应用的关于非负矩阵的诸多结果的 综述. 

8.1 非负矩阵一不等式及其推广 

设 B = [〜] € M ”. r •记 

B >0 , 如果所有 
B >0, 如果所有\>0* 

A 多如果 A — 

A>B, 如果 A — B >0. 

类似地可定义反向关系<和<.我们定义丨 A 丨 =[ 丨〜丨 ]• 如果 A >0: 则称 A 是非负矩阵， 
乂如果 A >0, 则称 A 是正 矩阵. 下列简单箏实可直接由定义推出. 

练习设 A , BeM „. r . 证明： 

<8. hi ) | A |>0 对每个 A 成立 * 丨 A I =0 当且仅当 A = 0. 

(8.1.2) UA I = |“ || A I 对所有 成立. 

(8. 1.3) I A + B I < I A I + I fi I • 

(8. 1.4) 如果 A^O & A 关 0, 则当”或 r 大于 1 时 A 〉0 不一定成立 • 

(8.1.5) 如果/ V 彡0, B >0, 且“， 6彡0,則 “ A 十紐 >0. 

(8. 1.6> 如果 A >£3 且 C > D , 則 A + C > i 3 + D . 

<8. 1.7) 如果 且 B 多 C , 则 

缠习现在假定 A , H , C , D 6 M ,, 且 y eC . 证明： 

(8. 1.8) I 九 r I < 丨 A 丨丨 *r I • 

(8.1.9) MB I < M || /^ I . 

(8. 1. 10) I I < I A |- 对所有 m = l , 2,… 成立. 

(8. 1. 11) 如果且 0< C < D ， 则 0 O \ C < BD . 

(8.1.12) 如果 0< A < 仏则对所有 m = l ， 2，… 成立. 

(8.1.13) 如果 A >0， 则如果 A >0， 则 A ，>0 对所有 m = l ， 2,… 成立. 
<8.1.14) 如果 A >0, j >0, Mx ^ O , 则 Aj >0. 

(8.1.15) 如果 A >0, i >0 且 Ar = 0， 则 A = 0. 

(8.1. 16> 如果 I .4 I < I , 则 || A || 2 < || B | U . 

(8.1.17) }\ Ah = || I A I \\ 2 . 


國 
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显然，最后两个论断对任意绝对范数都成立， Frobenius 范数（/ 2 范数）只是其中一个 例子. 
这些简单关系首先可应用于关于谱 t •径的不等式 • 


8.1.18 定理设 A ， B 6 M W . 如果丨 A 丨则 〆 AX〆 丨 A | )^ p ( B ). 

证明： 对每个 " i = l , 2，…，根据 （ 8. 1. 10) 和 （ 8. 1. 12), 有 | A " 丨 < | A 
根据 （ 8. 1. 16) 和 （ 8. 1. 17>, 对所有 m = l , 2,… • 不等式 

II A - || 2 < III A IU < II iT || 2 和 II A _ \ w m < II U r II B - 『成 立. 
在设 // I — oo 且运用 （5.6.14>， 便导 出 〆/ I A 丨 


W 此， 


如果现 

□ 


8.1.19 推论 设 A ， BeM .. 如果 则 〆 


8 .1. 2 0 推论 设如果 A >0， 乂加采 A 是八的任一主子矩阵，则 〆 特別 

证明： 设且设 A 是 / V 的 rur 主子方阵.设 A 表示把叉的各元排放在它们原来 
的位置(作为 A 的元 > lfti 把0元放作其余位置所构成的 ” X W 矩阵.于是且 
A , 所以根据推论 （8. 〗.9)玎知， p ( A )= p ( A )< P ( A ). □ 

对于一个不一定是 Hermhc * 矩阵的谱半径 来说. 上述推论中的下界^ A ) 是得到的第 
一个非 f •凡下界，不过 A 为非负的假定是本质的. 

练习 试构造一个相似于=1的矩阵， m 不次 零元. 它的 mt 径是什么？它是非负矩 

阵吗？关于推论 （8. 1.20) 的后一部分，这说明什么问题？ 

练习证明，如果 A , H 6 M ., H 0< A < B , 则 〆 提示： 存在某个 a > l 使得 
0 ^ A < aA < B . 如果 〆 关0,则从推沦 （ 8 . 1. I 9 > 可得出结论，如果 〆 /\) = 0,则把推论 
(8.1.20) 应用于13可得出结论. 

W 为我们马上就会有关于作负矩阵的进 f 径的较好上界，定理 （8. 18) 将用来氺任意矩阵的 
濟 t - 径的上界. 


81.21 引理 设辻假定如果 A 的各个行和是常数 • 则 〆 A )=|| Aj |... 如果 
A 的各个列和是常数，则 〆 

证明： 我们知道 . A 1对任意矩阵范数 IM 成立，但是，如果各行和是常数，则 
•r = [ l , …， 1] T 是关于特征值 j 的特征向把 M 样的论证应用于便得到关于列和的 
论断. □ 

8.1.22 定理 设 II 假定 A >0. 则 


R 


min < max (8. 1. 23) 

* fv 

min ^p(A) < max V« y (8. 1. 24) 



证明： 设《= minted , 然后构造新矩 阵扎使 且对所有 / = I ,2，〜 

^*^">-1 >=i 

成立.例如，如果 a = 0, 令 B = 0, 乂如果 a >0, 可以令 6 y 根据引理(& 1.21), 

户 ( 扪 = a ，又根据推论 （8. 1. 相应的上界易用类似的方法来 证明. 把行和界应 

用于 A T 便得到列和界. □ 

练习证明上述结果中关于上界的论断. 

n 

8.1.25 推论 设 A 6 M ”. 如果 A >0, il 对所有1=1，2•…， w 有2 〜 > 0,则 〆 A > > 0•特 

別是，如果 A >0,或#如果 A 是不可约非负矩阵，则 〆 A >>0. ’ _ 

»习证明不可约矩阵不可能有零行或零列. 

因为只要 S 可逆就有 〆 S l AS )^ p ( A ), 所以可以引进某些自由参数来推广上述定理•如 
，…，心〉，且所有 j .,>0, 则当 A >0 时 S - MSSO . 把定理 （8. 1.22) 应用于 
S-'AS = (^ J -^；- , ) t 便得到下述更一般的结果. 


8. 1.26 定理 

和 


设 A 6 M ，， 且假定 A >0. 则对任意正向 MieC ”， 有 
min 7^1“〆/ < max — 

minj- i 2 ^ ^ 户 (A> < maxa-,y] 

!*•. I i 倉 OCtU # ^ I J*# 


(8. 1.27) 

(8. 1.28) 


8.1.29 推论设 A 6 M ，， leiT , 且假定和 j *>0. 如果 a 、 /^0使以<九1<々，则 
<p(A)^. 如果 fliCAr ， 则如果 Ar < 和. • 则 〆 乃）<尽 


证明： 如果 a j < Ar ， 则《< mini . 1 [“ 〆 ，•由定理 （ 8 . 1 . 26 ) 得知•如果 or < 

Ar ， 则有某个 a '> a ， 使得 aXAr . 在这种情形 〆 A » a '> a , 所以 〆 A )> a . 类似地可证明 
上界. □ 


练习完成推论 (8. 1.29> 的证明. 


8.1.30 推论设 A 6 M ”， 且假定 A 非负.如果 A 有正特征向量 • 则相应的特征值是 〆 A ): 

即如果且：〉0和 A >0, 则 >= 〆 △>• 

证明： 如果 j *>0 且 A « r = A _ r ， 则 A >0 且另一方面，由推论 （8. 1. 29) 可知， 

8.1.31 推论设 AeM ，， 且假定/\是非负 矩阵. 如果 A 有正特征向贵，则 

1 X 1 1 心、 

〆 •々> = max min = min max 丄 (8. 1. 32) [ 493I 

x>0 ,= | *>0 X, L - - 1 

练习证明上述 推论.提示： 在 （8. 1.27> 中采用正特征向 董. 


8.1.33 推论设 A 6 M "， 且假定 A 是非负 矩阵. 如果 A 有正特征向量则对所有 




2，…和所有/=1，…，， I ，有 

- "1 「 _ 

« max x k min x k 额 

y . a )^ ^ 吟 •—— piAr 和 W - piAV ^ y ] a ： r \ (8.1.34) 
frf min x k max j* r rrf 

Idtn IvKiv J 

• J L 隹 

其中特別是，如果 〆 A )>0， 则对 w = l ， 2，…，[ 〆 △)• 各元一致有界. 
证明： 如果 Art ^ AU , 则如果 A >0， 则 A ”>0， 且有 

鳟 

/o(A)" max j = [A^x], ^ 

y-i 

对仟意 /=】• 2, …， W 成立. 因为 u >0. 所确定的上界坷由除法 得出. 类似地有 

m 

p^Ar m\nx k ^ piA) m Xi = [A-j*], = 

,<K - rr 

对任意 /=1, …， ； I 成立. 因为 J >0, 所确定的下界可由除法 得出. □ 

习题 

1. 如果 A >0, R 对某 个々， . A *>0, 证明 〆 A )>0. 

2. 给出一个 2 X 2 矩阵 A ， 使得 A >0, .4 不是正的，且 A 2 >0. 

3. 假定 A >0, HA ^ O . 如果/\有正特征向 W , 证明 〆 A >>0. 

4. 如果 〆 A ><1， 我们知道，当， / i — oo 时/ V "— 0. 如果 A >0, 11 A 有正特征向址，试用 
\ AH \ 推论 （& 1.33>证明 ， I 丨 So ( WC ；(>\) 对所有 w = l , 2，…成立，其中 C ( A ) 是常数矩阵. 

试考察 A = L 1 \\ 说明 A 冇止特征向试的假定不能省略.试从推论（5.6.13〉来讨论这两个 
结果. 

5. 如果 A >0 有特征向 《• 证明 A 相似于其各行和为常数的非负 矩阵. 这个常数是什么？ 
提示： 利用定理 （8. 1.26) 前面的注释. 

6 - 我们将在（&4>节证明，非负不可约矩阵必定有正特征向 M . 说明非负矩阵可以有正特 
征向 tt 而且是可约的. 

. 7. 设 A = U "] eiVt 是非负矩阵&有正特征向童1 = [4].试用 （8. 1.33) 证明， 

. 1 

对每个 /= i , 2, …，， ，成 立； 

( b 〉 j 人〜对每个2,…，” 成立. 、 

对所有 w = l ， 2，…， i 己 = 




8.2 正矩阵 


对正矩阵来说 • 非负矩阵理论显示出它的最简单和最优美的形式，关于这种情形， 
(). Perron 在1607年做出了主要的贡献. 

8. 2.1 引理 设 巨假定 A>0, Ar = Ao* ， j* 关 0 ，以及丨 A I = 户 ( 八） • 则 A | x | = 
piA) I 了丨 且丨 i 丨 >0. 

证明： 计算 / 

p(A) I a - I = U I I t I = I Ax I = I Ax I < I A I I x I -A I x I 
因而 I j - I - piA ) I j I ^0, 因为 I i 丨 » 且 U I 关0,所以由 （8. 1.14) 可知 A I x I >0. X 
推论 (&1.25) 保证 〆 A >〉0, 所以， 当义=0 时有 A U I =piA)\ «r I 和 I *r I = <0 ( A) M A \ s \ >0. 
如果 令 I I >0, 再运用 （8. 1. 14)： 

0 <, Ay = Az p(A)z 或 Az > p(A)z 

但是根据推论 （8. 1.29)， 我们有荒 if 的结论 〆 A )> p ( A >. 从而得知 >» = (), 证毕. □ 

由这个技术性引理，容易推导出关于正矩阵的第一个基本结果. 

8.2.2 定理 设 A 6 M ”， ii 假定/\坫正 矩阵. _ 〆 々>>(),是 A 的特征值，且存在正向 
M x 使得 As=p(A)x. 

证明： 存在特征值 A , J 1 U | =p(A)>0, lW 相应的特 征向诚 * r #0. 根据引理，所要求的 
向 tt 是丨 □ 
练习 如果 Ji .4>0, 试用推论 （8. 1.31) 证明 


p(A ) = 




只要稍微强化一 T 引理 (8. 2. 1>的叙述，就玎以加深对 A 的特征值的估计的认识. 

8.2.3 引理设 AeiW N ， ft 假定 A >0， Ax = Xx , j * 关0,以及 |A | = 〆 々>• 则对某个 (96 R , 

e ， 0 x= I x I >0. 

证明： 假设条件保证 I Aj . I = I U I = P (A) I j - I • 且由引理 （8. 2. 1> 可知 ， A I j * I = 
〆 々 ）U I fl U I >0. 综合这两个恒等式和三角不等式，对每个々=丨，… ，〜有 

p(A>| i = I A I I j-, I = I Ax* I = I 土 a*〆，I 

灣 m 

< 2 \ \\ x p \= ^]a k „ I ^ \ = p (A)\ x t |. 

因此，在三角不等式中等式必须成立， Wlfij (非零/复数 “〜 r p ， p = l ， •••，„，一定都位于复平 
面的同一条射 线上. 如果用沒表示它们的公共辐角，则对所有 />=1,…， „成 
立. 但是，因为所有 《* p >0, 所以有 ^*^>0. □ 

8 . 2 . 4 定理设 / V 6 M ”， 且假定 A 是正 矩阵. 则对每个特征值 A 关 〆 八>有 |A | < 〆 々>• 

证明： 根据定 义， U 丨 对 A 的所有特征值 A 成立. 假如 U 丨 = 〆 々），且 /^r = 
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A * r , j .关 0. 根据引理 <8.2.3), 对某个 (96 R 有 u ， e ^ ^>0,所以 Au ； = Au ，. 但是根据推论 
(8. 1. 30) 有 □ 

现在我们知道，如果 A 〉0, 则 〆 A > 可以看成严格最大模特征值，而不会有其他可 能性. 
_ 下-•个结果说明， 〆 A ) 是儿何重数为1的特 征值； 即相应于 〆 A ) 的特征空间有维数 1. 实际 
上，我们马上就会看到， 0( A ) 的代数重数也是 1. 

8. 2.5 定理设 AeiW ,， 且假定 A >0, u ， 和？是适八14，= 〆 ^^和的非零向设. 
则存在某个 a 6 C 使得 u ，= m . 

证明： 根据引理 （8.2. 3>,存在实数汰和込使得 p = t ^ z >0 和</三 〆 ％加>0.令卢 e 
mint/.P, 1 且定义 一 /?/>• 注意到 r>0 且 r 至少有一个坐标为 0, 所以 r 不是正向 M. 但是 

I < M 

Ar = Aq — pAp = p ( A ) q —^ p ( A ) p = p ( A ) r , 所以 • 如果 r 垆0，由 <8. 1.14) 可知 ， r = p ( A)'' x Ar 
>0. 因为这不成立 • 得出 r =0， W 而胙且 □ 

8. 2.6 推论设 A 6 M ”， 且假定 A >0. 则存在唯一向 Mi ， 使得 i >0 且 

i-i 

= 1 . 

练习址明推论 （8. 2.6〉. 

推论 （8. 2. 6) 中所描述的唯一的正规化特征向 tf 常常称为 A 的 Perron 向 M ; ^ A ) 常常称 
为/\的 Perron 根. 当然，如果 A 是正矩阵，则亦是，所以，上述所有结果也可以应用于 
A T . A 7 ■的 Perron 向置称为 A 的左 Perron 向址. 

练习如果且 A >0, 乂如果存在某个 《 reC ”， 使得 x ^0, 且 Ar = Ai , 
证明 是 A 的 Perron 向 tt 的倍数且 X = p ( A ). 

我们对研究%时幕 A ” 的变化过程感兴趣，因为这些幂出现在数值分析的应用中以及 
槪率论中的 Markov 链理论的应 用中. 下面的引理把对于非负矩阵的各个极限定理是本质的诸 
条件分离开来 • 注意 • 如果 A >0 且 A = p ( A ), 则所有假设条件都适合. 

[497] 8.2.7 引理设是给定的矩阵， A 6 C 是给定的数，且假定 i 和: y 是适合 

(1) Ax=Xxi 

(2) A 7 ■广 A . v , 

(3) j - = 1 * 

的向 tt . 定义•: y T .则 

( a ) L*r = 且 y r L =/; 

( b ) L " = L 对所有 w = l , 2,… 成立； 

( c > A "* L = bV"=Al 对所有 w = l ， 2,…成立： 

( d ) UA - XL )=0； . 

< c ) ( A - AL )"*= A ”一 A，-L 对所有/71 = 1，2,… 成立； 

( f ) A - XL 的每个非零特征值也是 A 的特征值. 

如果另外还假定 
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(4) A 关0 

(5> A 是的 A 的特征值，且有几 何重数 1;于是还有 

( g ) A 不是的特征值；即 A/—(A — AU 是可逆矩阵. 
tt 后，如果假定 

(6) | A I =^(^)>0； 

(7) A 是/\的模为 〆 A ) 的仅有特征值；乂如果把 A 的特征值排成顺序丨 A , 丨< | A : I 

< Un - . I < U „ | = U I =户(>\),则 

( h ) p ( A - AL )^ I A .-, I < p ( A )； 

( i ) 丐 / woo 时 ， (A - , A )- = L + (A l A - Lr -^ L ； 

( j ) 对每个适合 [U • |“( A )]< r<l 的 r , 存在某 fC = C ：( r ， A ), 使得 || Cl 〃 AK • — , 

<( V ” 对所有 w = l , 2, … 成立. 

证明： 论断 （aK ( b ) 和 （ c > 可 fl 接从假定<1>, (2> 和 （3) 推出》注意 （3) 推出， 1 和>^都是 
非零向 《• 论断 （ ci ) 可以由 < b > 和 （ c > 推出.命题 （ e > 可以用和 （ c ) 来归纳证明.如果"关0是 
A — 又广的特征值，乂如果对某个 u ，/0 有 （ A — ADu ^/ m ，， 

IW 1^=0. W 此， （ A — AUu »= Atr =/ iU ., 所以尸也是 A 的特征值，⑴ 得证. 098 

如果现在引用假设 U ) LL 取上述论证说明，如果 u ； 是 A — A / •的特征向 M , 则 u ， 也 
足 A 的 A 的特征向根据假设（5>，我们一定可得出 u ，= o . i •对*个《关0 成立. 另一方面， 

^ = Ai^=(A - A /.) u *=( A-AUaj = aAx - Aa.r = 0, 乂因为 A 关0且 所以这是不可 能的. 

这个矛盾证明了 （ g >. W 为 （ n , 我们知迫， 或荇对 A 的某个特征值有 〆 A — AU = I • 

或者 〆 A — AL > = 0. W 为已纶出了 A 的特征值的递增顺序 ，II U . I = U I = p ( A ), 所以由 
( g > 可知，在这两种悄形， p ( A - XL )^ I A , , | . 因此 （ M 中的不等式可 ft 接由 （7) 推出. 把 （ h ) 

和 （ e ) 结合起来不难猝出，当 w —* co 时 U 1 八一厂 >*" = U ' A) m — L ^ O , 这是 W 为 〆 /TM /.) = 
p ( A - XU / p ( A )^ I A „ , I /^( AXl . ( j > 中的收敛速度 是推论 （5. 6. 13) 应用于矩阵 A ' A-L 
的 11 接推论，其中选取 e 适合 〆 A ' A - U + e^C I A . , I /^(^)]+€<^1. □ 

S 习给出引理中 （ a >，（ b > 和 （ c ) 的证明细节. 

8.2.8 定理设/\6从„且假定 A >0 .则 

limC / jC . A ) ' A~] m = L f 

其中， L ^ xy 1 , Ax ^= p ( A ) x 9 A , y = p ( A ) y . j ->0, . y >0 且 = 

证明： 引理的假定 U > (7>为 A = p ( A ) 所满足， x 是 A 的 Perron 向 M ， 且: y = (r 1 2 ， 

其中 z 是/ \ 7 的？^1" 0 11 向 M . 结论珂由 （ i ) 推出. □ 

8.2.9 推论如果 A 6 M ” aA >0， 则 L 三 liniCyA ) ' A ]" 1 是秩1的正 矩阵. 

8.2.10 定理如果 & A >0. 则 〆 是代数 t 数为1的特 征值； 即 〆 A > 是特征方程 
A ^/)=0 的单根. 

证明： 根据84111*三角化定理（2.3.1)，可以记 A = L ^ L 7、 其中， C ； 是酉矩阵，厶是主对 
角 元为! 0，…，屮 A * h ， …， A „ 的上三角矩阵，且^二 〆 々）是代数重数々>1的特征值；对所有 
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[4991 ，=々+ 1,…，《，特征值的模都严格小于 〆 A >. 另一方面, 

L = 



其中，在后 w 个表示中对角元丨 ® a 々次，在最后一个表示式中对角0元 t 复 次. 因为 
垴后表示式中的上三角矩阵至少有秩々，乂 W 为 L 有秩1,得知， 4>1 是不可能的. o 

我们现在总结一下在本节中得到的关于正矩阵的基本结果. 

8.2.11 Perron 定理 如果 且 A >0, 则 

( a ) P ( A )>0 t 

的特征值, 

( c ) 存在 • reC "， 适合 j *>0 且 

( d ) pOU 是 A 的代数 （ W 而几何）单重特征值* 

( e ) I A I 对每个特征值 A 关 〆 A ) 成立，即 〆 A ) 是唯 一的最 大模特 征值； 

(f) 当" ， ― ⑺时匸 〆 々） 'A]--*-L, 其中 L 兰 jy ， Ax=piA)x, A T y=p(A)y, x>0, y>0 
E s r y=\. 

Perron 定理有许多 应用. 一个优美 而 乂有效的应用是，利用占优非负矩阵的谱半径和主 
_ 对角元得到了矩阵 A 的特征值包含区域. 

8.2.12 定理（樊 畿） 设八=[〜]6从，且假定有非负元和 | A 丨 • 则 A 的 
每个特征值位于区域 

n 

U e c : I z — a M \^p(B) — b „} 

• -I 

中. 

证明： 可以假定 B 〉0, 因为如果 B 的某个元是零，我们可以考虑坎三[〜 + e ]， 其中 e > 
0; B t > I A I ,且当 e —0 时 〆 B ,) — （6"+ e )— V )( i 3>— 根据 Perron 定理，存在正向撖 j •使 



得因而对所有 i = l ， 2，…，71有 


\ eta \ J：, 2 ^*> x / = — 6„x,. 


因此，对所有；=1，2, …， n 有 

-^2 I a，i | Si < ^(B) — b„. 

Xi 

，本 i 

在推论 （6.1.6〉 中取久 = o •.便推出要求的结果. □ 

(8.2. 11) 中的 （ f > 保证确定的极限存在，而 (8.2. 7>中的 ( j ) 给出了关于收敛速度的一个上界 

II lp(Ar l Ay-Ll. t <Cr-, 

这个上界对某个与 A 和 r 有关的正常数 C 和任何适合 

i -TXT<r< 1 
p( A) 

的 r 成立，其中，是 A 的有第二大模的特征值.即使 〆 A > 已知或容易估计，但是要想得出 
关于比值丨夂叫丨 //)( A > 的有用界，计算或估计丨丨也许不方便或者不可能.在这种情形， 
知道一个容易计算的界可能很有用，这个 界厲于 E . Hopf , 它对任何正矩阵 A =[ 心] eAt 都 
成立： 

1 A »-1 I ^ M — /j .. 

其中 M=max<“ v : !• j = lf 2, —• /?} 而 ； i = minU, >: i, )=1 ， 2, … ， w}. 

习题 

1. 如果 A >0, * r 是 A 的 Perron 向«，乂如果 z 是 A r 的 Perron 向撖，证明 ikX ). 

2. 如采是具有々个非芩主对角元的上一角 矩阵， 证明 ran kd > t 用例子说明，在 
这些条件下 • 有可能秩大于务. 

3. 把本节推导出的结果应用于矩阵 


M-/i 
M + /X 


< 1, 


丽 


=[V 


0 < 




且与 （8.0) 节中的相关结论相比较. 

4. 如 （8.0) 节中所描述的那样 • 考虑具有 / i >2 个城市的一般城市间的人口流动模型•如 
果所有人口流动系数是正的，那么，当 m — oo 时，人口分布 〆 ”、的渐近变化过程是什么？ 

5. 如果 A >0, 详细描述当； 7 i — oc 时•的渐近变化过程. 提示： 存在三种 情形： 0, 
A ” 1 发散和收敛于正矩阵.说明并分析每种 情形. 

6. 在推论 (6. 1. 8>下面有一个讨论 2 X 2 正矩阵的练习试用定理 （8. 2. 2) 下面的练习讨论这 
个例子.‘ 

7. 设 A ， BeM m 9 且假定试且 〆 B ) 的 “min max ”特征证明 〆 A )〉 〆 ^) •提 
示：设 J 是 A 的适合的 Perron 向镫. 

8. 如果 A > 0 ， 且 I 是 A 的 Perron 向货，证明 
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— A ) = 2^ v - r >. 

*•>-1 

由定义可知， A 十…+心二 1. 

9. 如果正矩阵是非奇异的，证明其逆矩阵可能不是非负的.如果非负矩阵 A 是非奇异的， 
证明，仅当 A 的每一列中恰好有一个非零元时，其逆矩阵才可以是非负的.这样的矩阵与置 
换矩阵有何关系？ 

10. 试给出定理 （8. 2. 10) 的下述另一个证明的 细节： 如果有代数重数乂如 
果: V 和 I 分別是 A 的左和右 Perron 向 W , 则存在非零向 M z 使得 *r = ( A — 〆 〉 z . 另一方面， 
y r x = y T ( A - p1 ) z = 0 T z = 0 , 因为 / x >0, 所以这是不可 能的. 提示： 因为 p 的几何重数是1, 

5021 所以 A —〆 的 Jordan 形一定恰好有一个幂零子块 • 它至少应该是二阶.证明秩为々一1(々>1> 
的任一幕零矩阵有以下 性质： 如果对某个 w ec * 有 B w =0， 则存在某个 v € C * 使得 
Bv — u. 

进一步阅读 集中论述各种界（其中包括本节 fi 后 -- 段提到的 Hopf 界） 以及有关这方面的 
众多文 献， 可参看 U. Rothblum and C. Tan. 44 Upper Bounds on the Maximum Modulus of 
Subdominant Eigenvalues of Nonnegative Matrices, M L/w^r Algebra Appl . 66( 1985), 45-86. 
也 pf 参我： Kel]chapter [I • theorem 2. 

8.3 非 负矩阵 

因为在实际中常常遇到不是正矩阵的非负矩阵，为此 • 滿要考虑把上一节中所论述的理论 
推广到矩阵的元索不都是严格正的 悄形. 我们可能希 ffl , 这种推广可通过取适当的极限来完 
成，这对于某些结果是可以办 到的. 但 M , 令人失望的是 • 像秩与维数这样一些 W 不是连续函 
数，所以极限论证只是部分有效. ft Perron 定理中可以通过取极限作推广的仅有结果包括在 
下面的定理中. 

8.3.1 定理如采 fiA ^ O , 则 〆 是 A 的特征值，且存在非负向 i 关 0, 
使得九 r =^ Ah . 

证明： 对任意 e >0， 定义三 O v + e ]〉0. 用 j * U ) 表示 A ( e >的 Perron 向撤，所以 

n 

• r ( e >>0 且= 1•因为向燉集 U ( € >: e >0} 包含在紧集 U : x 6 C \ II «r || • < 1丨中，所 

卜 I 

以存在 单调递减序列 d ， e 2 • …且 lime*=0 ， 使得 lim x(e* > = j ■存 在. W 为对所有 4=1 ， 2, 
…有 i(e*)>0 ， 所以一定有 j=lim 乂 

鲰 H 

X - r , = = 1 

所以 x = 0 是不可能的.根据定理 （8. 1. 18)，>>>…彡 〆 A ) 对所有 k =], 
2,…成立，所以实数序列 ••是 单调递减 序列. 因此，户叫 存在丑 p 
^( A ). 但是由事实 


Ar = !im A(€*)jU*) = lim A(c*) )x(e*) 



和事实 T 关0,推出 P 是 A 的特 征值. 另一方面，因此一定有 □ 
关于谱半径的变分特征部分 (8. 1.31) 可以推广到一般非负矩阵和非负向量，不过其证明是 
颇不相同的. 

8.3.2 定理设 A 6 M "， A ^ O , j 6 C "， j •彡0且 j 关 0. 如果对某个 fl 6 R , Ax ^ ax , 则 〆 A > 
^o. 

证明： 设 A =| :〜 ]， 设 e >0, 且定义 = + e ]. 于是 A ( e >>0, 所以有正的左 



aJr > 0 t 因而:— 因为 对所有 e >0. 


有 〆 A ( c )〉一 tf >0. 但当 c — 0时 〆 AU )>- v (/\>, 所以 〆 A ) 彡 a . 


□ 


8.3.3 推论 如果且 A >0, 则 

/ o ( A ) = max min 丄 

证明： 如果 A >0, J -^ O , 且 J * 关 0, 乂如果选取 

a = min * 

则根据定理 （8. 3. 因而但是如果选取为由定理 （8. 3.】） 保证其存在 

的特征 向緻， 那么我们看到这个上界可以用 d =^/\> 来达到. □ 

*习考虑 A= C 口和 j = [:]， 证明， 如果 I 不是正向 M , (8. 1. 29> 的上界不一•定成 

立. 证明 （8. 1.32) 的 “min max ” 特征一般也不 成立. 然而，如上述推论所证明的那样， “ max 
min” 特征的确可以推广. 

添加-个假设条件，可以稍傲强化定理 (8. 3. 2) 以给出关于向 Mu •的某些 信息. 


8.3.4 定理设 A 6 M ，， 且 A >0, 冉假定 A 有正左特征向该.如果乂如果 Ar 
^p(A)s, SiJ Ax=piA)x. 

证明： 设: y 〉0 适合 ft 假定1彡0适合和 Ar — 〆 A )* rX ) •则 

y T lAr 一 〆 A>*r] = p(A)y J x — p(A)y r x = 0, 

所以一定有 Ax—p(A)x=0. 口 

+添加假设 条件， 不可能比定理 ( 8. 3. 1>更进一步把 Perron 定理 (8. 2. 11) 推广到非负 矩阵. 

当 A € 且 A >0 时， 非负特征值 〆 A ) 称为 A 的 Perron 根.因为相应于非负矩阵的 
Perron 根的特征向鼉未必是唯一确定的，所以对于一般非负矩阵（不同于力是正矩阵的情 形）， 
没有关于 “ Perron 向世”的完全确定的 槪念. 例如 • 非负矩阵/有每个非负向贵作为相应于 
Perron 根 〆 A > = 1 的特征向最 • 

习题 


1. 用例子说明，在 Peiron 定理 (8. 2. 11) 中的不包括在定理 (8.3. 1) 中的各项命题对所有非 
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•o r 

ri on ro 

r 


和 


Lo oJ 

Lo 1 」 Li 

0- 


负矩阵一般不成立. 提示： 考虑 

2. 如果且对某个 々彡 1有 A 4 >0, 证明 A 有正特征向 M . 

3. 如果有非负特征向 *_ r , 其中冇 r>l 个正分址和 n — r 个零分 M , 证明， A 经置 

rB Cl 


换相似可以变成形式 


• 0 D. 


其中 Be Mr ， 


D6M„ r , B, C 和 D 是非负矩阵， 


且 B 有正特征向如果 r </ i , 证明/\ 一定是可约矩阵. 

4. 用例子说明，推论 （8. 1.30) 的下述推广不 成立： 设 A 多 0. 如果 A 有非负特征向最 
0，则 

5. 考虑矩阵 A = = 和向 M * r =[ l ，2； T . 说明，如果只假定定理 （8.3.4) 是不 
成立的. A 的左和右 Perron 向姑是 什么？ 

6. 如果证明，存在与 .4 交换的正矩阵当且仅当 A 有全是正的左和右特征向 
提示： 如果了和 y 是 A 的正右特征向嫩和正左特征向嫩，设 B = 反之，如果 

505] S . Ajc = p { A ) s , 考虑 BAr = ARr = ^ o ( A > j >0. 

7. 如果 A = [〜]6 M , 是非负三对角矩阵，证明 A 的所有特征值都是 实的.提示： 首先证 
明，如果所有下和上对角元都是正的，则可以求得正对角矩阵 D 使得 D iAf ) 是对称矩阵.然 
后证明对角线以上或以下的0元是无关紧要的. 

8. 设非负矩阵是给 定的. 证明 • 或者 A 是不可约的 • 或#存在貲换矩阵 P 使得 

A *■ 

P T AP = ••• • 

° A .. 

其中，每个 A , 或者是不可约矩阵，或者是 1 X 1 零矩阵， ，- =1, k . 这种形式称为 A 的不 

k 

可约正规形式，注意 . WA ) = [J U 八的不可约正规形式未必唯 一• 

I 

9. 矩阵 A =[ 〜] € M ,( R ) 称为本性非负矩阵，是指其所有非对角元〜 （，关 ）） 都是非 负的. 

证明， 如果 A 是本性非负矩阵，则有某个 a >0 使得 + 试用这一论断以及 （8.3. 1) 证 

明，如果是本性非负矩阵，则 A 有实特征值 r ( AM 常称其为 A 的优势特征值），巨有 
如下 性质： 对 A 的每个特征值 A •有 r ( A » KeA ,. 址明， KA ) 不一定是 A 的具有最大模的特征 
值，但当 A >0 时以>\)= 〆 ^〉. 提示： A /+ A 的诸特征值为 A + A ,. 

10. 定理 (8. 1. 18) 是说，若 A 6 M ■是非负矩阵，则当•也是非负矩阵时有 〆 A + B ) 

这是关于谱半径的一种单调性结果.如果•是本性非负矩阵（见习题 9) ，证明， 
对所有对角矩阵 D 6 M ”（ R)，A + D 是本性非负 矩阵. 如果 A 是给定的本性非负矩阵，而 D 允 
许在实对角矩阵类中变化，则可得知，优势特征值 r(A + D ) 是 D 的诸对角元的一个凸函数 . ：, 
进一步阅读参# 以下 文章： C . Johnson , R . Kellogg , and A . Stephens , 44 Complex 



非负矩阵 


359 


Eigenvalues of a Nonnegative Matrix with a Specified Graph II , '' Lin . Multilin . Alg . 7 (1979)， 
129-143， 以及 C . Johnson . “Row Stochastic Matrices Similar to Doubly Stochastic Matrices ，，’ 

Lin . Multilin . Al ^. 10 (1981), 113-130. 可以了解有关非负矩阵可能具有的特征值这一重要 
论题的一些结果.这些文章给出一些参考 文献. 其中包括 Dmitriev , Dynkm 和 Karpelevich 的 _ 
经典 T 作，以及非负逆特征值问题.后一个问题（刻划可以是非负矩阵的谱的复数集的特征）尚 
未解决.关于习题 10的其他信息可参看 J . Cohen , “Convexity of the Dominant Eigenvalue of 
an Essentially Nonnegative Matrix. w Pruc . Amer . Math . Soc . 81 (1981)，657-658. 也可参看 
(8. 4) 节 15 题. 

8.4 不可约非负矩阵 


如果能够对不含任何0元的矩阵证明一结论 • 那么这个结论常常推广到不可约矩阵，这 
是一个颇具启发性的有用 法则. 我们在第6章推广基本的 Gedgorin 定理时，已有这个法则的 
一个例证，现在要给出另一个例证.其基本思想已在定理 （6.2.24) 中得到 证明； 这里東述其相 
关的部分. 

8. 4.1 引理设 ii 假定 A >0. 那么， A 是不可约矩阵，当旦仅当 （/ + A )” M >0. 

练习如果证明， A 是不可约的，当且仅当是不可约的. 

B 前，我们还需要 T 述简单的结果. 

8.4.2 引理设迀设又，，…， 夂是 A 的特征值（计重特征值）.则义 1 + 1,…， A . + 1 
是 J + A 的特征值且 〆 / + A >< l + j 0 ( A >. 如果 A >0, 则 〆 /十八）：！. 〆 々〉. 

证明： 设有®数々，则 A 是特征方程 p A (/> = det ( f / — A )=0 的々重 根. 另外，因 
det (/7- A ) = det [(/+ l )/-( A +/)], 所以 A f 1 是 = — （ A + /)] = 0 的々 重根. 

f 是 +1，…， A ” + l 是 A f / 的特 征值. 因此， / o (/^- A ) = max | A . + l | <max | A , | 十1 = 

1+^ a ). 但是，当时，根据 （ 8. 3 . i >, 1+户 ( 八>是 /+ A 的特征值，囚此 • in 这种情形， 
j o (/ + A ) = H - j 0 ( A ). □ 

练习试说明，为了证明上述引理的前一部分，下述论证为什么是不完 全的： 如果 A 是 A 
的特征值，则存在某个向 tt ^ r 关0使得 = 但是 ， （A + /> i=U + 1) j *， 所以 A + 1 是/\+ [507 
I 的特征值. 

8.4.3 引理如果 A 6 M ”， 且对某个々>1有 A *>0, 则 〆 A ) 是 A 的代数单重特征值. 

证明：如果 A ,， …， A •是 A 的特征值，則 A {， …， A * ■是 A * 的特 征值. 由定理 （8.3. 】）可 
知， 〆 A ) 是 A 的特征值，因此，假如 〆 /\>是 A 的重特征值，则 〆 焱>*= 〆 ^)是 A * 的重特征 
值. 但这是不可能的，因为由定理 （8.2. 10) 可知， 〆 AM 是 V 的单重特征值. 

现在将可看到，在多大程度 h Perron 定理可以推广到非负不可约矩阵.把正矩阵的 
Perron 结果推广到非负矩阵，是与 Fmbenius 的名字分不开的. 

8.4.4 定理设 A 6 M •，且假定 A 是不可约非负矩阵•则 
( a ) P CA )>0； 
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( b ) 0( A ) 是 A 的特 征值； 

( c ) 存在正向 M j •使得几 r = 7 )( A ) x : 

( d ) 是 A 的代数 ( 因而几何>单重特 征值. 

证明：推论 （8. 1.25) 说明，即使在比不可约性更弱的条件下，仍然成立.根据定理 
(8.3.1), 论断 （ b > 对所有非负矩阵成立，同时它保证存在适合•的非负向 M * r 关 0. 
另一方面， (/- l - A )"- , .r = [14-, o ( A )]" ' x , 乂根据引理 （8.4. 1), 矩阵 + 是正的，所以 
由 （8. 1.14) 可知•向量 （ f + A ) •一 1 j •一定是正的.因此了 =[1+^糸）]1 "(f + Ar -^ X ). 为了 
证明 （ d >， 利用弓『理 （8 . 4 . 2) 可证，如果 〆 是 A 的歌特征值，则 l +^ A^^Z + A ) 是 / + A 
的東特征值. 但是 / + A >0, &根 据引理 （8.4. 1 >， (/-f A )" '>0, 因此由引理 （8. 4. 3) 可知， 
1+ 〆 ，）一定是 / + A 的单《特 征值. □ 

该定理保证，不可约非负矩阵相应于 Perron 根的特征空间是一 维的. 对于不可约非负矩 
_ 阵，其分 撖和为 1的唯一正特征向 M 称为 Perron 向量. 

因为不可约非负矩阵有正特征向挝，所以 （8. 1>节末的诸结果可以应用于这类矩阵，其中 
特别®要的是 iS 半径的变分特征 （8. 1.32>.另外，/ V 不可约，当且仅当 A 不可约，所以不可 
约非负矩阵也有正左特征向 M . W 此，定理 （8.3.4) 对不可约非负矩阵 成立. 这个枣实在定理 
(8. 1. 18) 的下述推广中是关键的. 

8.4 .S 定理设八，假定 A 是不可约非负矩阵，且 A 多 IBI . 则 〆 •如 
果^^\)= 〆 /^，乂 A = 是 B 的特征值，则 存在况 •…，久 6 R 使得 ZiseDAD - 1 ， 其 

中 D = diag ( f % ，…， e 9 -). 

证明： 由定理 (8. 1. 18) 已经知道，如果 .4 彡|谷|，则 〆 A )^ o (/3). 如果 〆 A )= 〆 谷）， 
则存在某个 j •关0,使得 Rr = Ai , a | A | = p ( B )= p ( A ). 因而 

尸 M > U 1 = 1 Ax | = | Zir |<| U |<八 I j |. 

因为 A 是不可约矩阵，所以，根据定理 （8.3.4 >可知 • A \ jr \ = p ( A ) 丨丨 • ㈥ 而丨 iir | = 

I B 丨 \ x \ = A \ j-l . 此外，定理（8.4.4>的（0>和（(|)也_屯涵 | I | >0,又因为 | /H < A ， 
所以由 （ 8. 】• 15 > 和丨 B 丨丨 . r 丨 = A U 丨的事实推出丨 B 丨= A . 如果定义久€ R 为，* = 
心/ I a I ，々 = 1，…，"，如果又如果令 D 三 diag ( 〆 ， •…， 〆 〜），则 | I | 
R Xx = e ，9 p ( A)D I j - I =BD \ x \ = Bx . 因此，卜 D • BD | j * | =^ A > | i | = A | i | •这 
个恒等式连同丨 •/* I >0 和 I 卜 —D ' BD |= 乃的事实蕴涵 〆 'BD = A . □ 

练习对上述证明的 M 后一部分，给出其证明细节. 提示： SC = e * 且注意到 

A U | = CU |-| Cl x ||<| C|| x | = A | |, 

因而在三角不等式中等式 成立. 辐角 argky | j *, 丨 > =常数， c l ; ^0, 且心二⑷. 

当 A >0 时，由 Perron 定理可知， 〆 的有最大模的唯—特 征值. 当时，可能 
存在多个有极大模的特征倌，不过，在这种情形 • .4 应该有特殊的形式 • 且这些特征值应该位 
于一个很规则的图形内. 

一 8. 4.6 推论设 AeM ， 假定 A 是不可约非负矩阵，义假定具有极大模特征值 〆 的集合 S = 
^9] { X n = piA ), A , , , — • Am } 恰好有 A 个互不相同 的元. 则每个特征值 A , 有代数重数1，旦 
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S = { e 2n , f ,/ i p ( A)：p = 0，1，…，々一1}， 

即这些极大模特征值正好是々个次单位根与 〆 A > 的乘积，另外，如果 A 是 A 的任一特征值， 

则对所有 P =0, 1，…，▲一 1, 是特征值. 

证明：对于 《 S 中的每个特征值，记= ,，|0(八 ）， p = 0， 1，…，々一1，也 就是 ％ e 
arg ( A ^). 假定々>1,如果有必要，可以重新标记诸特征值.如果还有必要，也可以重新定 
义辐角使得 0 = ^<心<矜 <… <0 —,<2 ir . 利用上述定理 • a 取和;得知，对 
户= 0, 1， …， 々一 1有 A = B 因相似于 A , 所以它与 A 有相同的待征 

值，因此这个恒等式说明，对任意/> = 0, 1,…，々一 1,如果 A 的特征值集合在复平面内作角 
〜的 旋转，则它仍变到 H 身；（只要证明％ = 2 ttP / W 这就是上述最后一个 论断. 此外，已知 A , 
= p ( A ) 是 A 的代数单重特征值（因为 A 是不可约的），所以依次令 p = l , 2,…， k - U 便得 
出所有 p 也是代数单重特征值. 

不过，还可以说得更详细 一些. 因为对每个 p = 0, 1,…， A —1, S ={ A ., A .-,, 

A ” “ iX ，， 八， r — M , ,，…， 〆 〜_“•}， 所以一定存在某个 (? = (/(/>> 使得 〆 = 

即对每 个户， 都存在*个尸7(/>) 使得％ = 2 tt — ％[即怜=一片 （ mod 2 ir >]， 因而 ， e ^ p ( A ) eS . 

另外，如果*复定理 （8. 4.5) 给出的关于/ \ 的表示式，并且对于任意选定的适合 m 
<走一1 的 r ， m , 取 1 和 _=，* v > M )， 则得出 

A = ， D r U ，，_ D _ AD _ MD ; 1 = D r D m MD r D m r l . 

因此，根据上述相同的论 证. 在 g 平面内， A 的特征馆*合经卜的旋转变到 A 身. 特別 
进， ，•乂 >(△> 一定是 A 的（具有极大 模的） 特征值，所以对某个 r >，一 
定有史 m + 史,=< mod 27 c ). 

考虑集合 C ；=<^=0, p ， …， 2 i ,). 上一段已提供 了以下信息： ( a )06 G , 

( b ) 如果 A ， ( p , e 0 9 则史, + 妁 （ mod 27 i ) eG ; ( c ) 如果於 6 C ；， 则一 p ( mod 2 jr ) eC ；. 另外显然有， 

( d ) 如果弘， < p ,^ G , 则沪+妗=弘 I 沪 （ mod 27 T >. 因此， G 是恰好有々个元索的 Abel 群*群的运 
算是“关于模为 2 tt 的加 法”. W 为有限 Abel 群任一元素的阶一定整除群的阶，所以每个，《 一定 [5 ]o 
是/»次单位根，其中/ >=/>(/«) 是 ▲ 的 W +. 另外 • 我们可以不用群的理 论直接 证明这一书实 • 

W 为对某个）以及每个 r 和/ w 有卜十妁 < mo d 270, 用归纳法可得出，（令 r = w==1) 对 
所有 r =0， 1，2, •••( mod 2 it ) 有 rpeG ; 即对所有 r =0， 1，2, •“有 e 〜( A >6 S . 但是，假 
如 ，•不 是单位根，这便蕴涵 S 有无限多个不同的元索.而这是不可 能的. 因此，对某个适合 
1</><々的/>，^ = 1,可假定/>是使这个式子成立的最小整数.我们知道， 0< p < 於<〜< 

?” *+ i <2 w ， 且对某个固定指数 m 考虑恰好可用/ » + 1 个点0,灼，2炉,，…， （/> 一 l ) p , 
户0=271将区间[0, 分成 p 个 f •幵子区间（在右边开）：点％ —定落在这些子区间的一个 
中. 于是，存在某个适合1的 g 使得外 灼； 即—外 沪. 因此， 

对某个）=)(爪>， 一定书^-聊= 9 ,， 这是因为已经证明，如果， p ( A > 是特征值，则 
〆 ％ 〆 △)和 〆 听、"7)(八)也是特 征值. 另一方面，〈沪，且选定 9 i 是最小非零辐 
角，因而一定有％—外 >!=()• 这就说明每个辐角仍是炉的某个倍数，所以必定是/»=々：即炉= 

2兀/々，因为假如/><々，则在集合彳 〆 e 2，r ' pCA ), e 3 ^ p ( A ), … } 中的不同的 元素会 少于是 



个，然而这个集合一定等于整个 s . 最后，因为每个％是灼 =2 tt / 々的某个倍数，又因为存在々 
个不同的弘项和々个沪的不同倍数，所以对所有 w = 0， 1，2，…，♦一 1 一定有％ =历炉. 

整个证明是在々>1的假定下进行的，但是，如果々 = 1，所作的论断是显然的. □ 

8.4.7 附注如果是不可约的，且有々>】个极大模特征值，则 A 的每个非零特征值位 
于中心在 C 中的0的一个岡上，这个圆恰好经过 A 的 々个特 征值，且使它们在整个阆上都保 
持相同的间 隔. >.¥ 別是，々必须是 A 的非零特征值的个数的因子.因此，如果 A 是非奇 
异不可约非负矩阵，且 n 是素数，则一定存在一个或〃个极大模特 征值； 不会有其他可能性. 

8. 4.8 推论 假定 A 6 M ， 是不可约非负矩阵，且记广]， w = i , 2, •••• 如果正好存 
在 A 的 々〉1 个具有极大模的特征值，则当 w 不是 A 的整数倍时， a \ r '=0 对所有1=1,2, 
…， w 成立. 特別是所有 〜=0. 

证明： 利用推论（8.4.6> 选取 A 的一个极大模特征值 A = f * V ( A ), 其中史 =2 ttA . 于是， 
只要 m 不是 A 的整数倍， f 就不是正 实数. 利用定理 （8.4. 5>，且取 B — A # A = V >( A ), 得 
出 A = e lf DAD 丨，所以对于所有 i = l ，…， w 和 /w = l ， 2，3，…，有 A " = M 和 a ， 

= 如果^不是正实数，乂如果^’>0,则这个等式不可能成立，因此，当 m 不是走 

的倍数时，对所有/=1, •••• 〜一定有“: s 0. □ 

练习 假定 A € iV ^ 是不可约非负 矩阵. 证明，为了保证 〆 A > 是 A 的唯一极大模特值 ，其 
充分条件是某 个〜关 0. 但是， 考察矩阵 

t) 1 1' 

1 0 1 
•I 1 0. 

并说明这个条件不是必要的，你能找一个 2 X 2 矩阵的反例吗？ 

8.4.9 附注 比推论 （8.4. 8>更强的结论仍 成立： 如果 A >0 是不可约矩阵，且有 A >1 个具有 
极大模的特征值，则存在 g 换矩阵 P 使得 



其中，々个主对角零子块是方阵而所列出的诸子块不一定是零 矩阵. 特別地，所有主对角 
元〜必 须是零 [ Var ， p . 28]. 

为了得到在推论 (8. 4. 6) 中所描述的极大模特征值的规则图形，尽管不可约性假设是本质 
的，但是在一般情形下不仍然可以得到某些信息. 

8 .4.10 推论如果 A ^ O , 〆 々）>()，如果 A 是 A 的适合丨 A | = 〆 △)的特征值，则 
A />( A )=^ 是单位根，对某个适合的走有 〆 ，=1，且对所有 p = 0， 1，2,…， k -1， 
e ， o ( A ) 都是 A 的特征值. 

证明： 如果 A 是不可约的，则论断可由推论 (8. 4. 6) 推出. 如果 A 可约，则 A 可经置换相 
似变成分块上三角形式 


A 


a 2 


LO AJ 

其中 4 是不可约方阵或零 方阵. A 的特征值是各对角子块矩阵，…，的特征值的并, 
且每个 A , 的极大模特征值集合的结构由推论 ( 8 . 4 . 8 ) 给出. □ 

练习 设 

A ' = [°i i] 和 … = 

通 过考察 

A= [ A o :J eMs 

来说明，对于一般的非负矩阵 A ， A 的极大模特征值可能比 〆 以及 〆 A ) 经过一个单位根的 
各次幕的旋转所得到的集合要多. 

习题 

1 . 用例子说明，未列入到定理 ( 8 . 4 . 中的 Perron 定理 （ 8 . 2 . 11 ) 中的各项命题对不可约非 
负矩阵一般不成立. 

2 . 用例子说明 • + 对所有 A € M ” 不 成立. 试给出使这恒等式成立的关于 



A 的必要充分条件. 


3 . 不可约性是非负矩阵有正特征向#的充分条件而不是必要 条件. 试考察门 1_ |和 

LO 0 J 

\ 说明可约非负矩阵可能有或可能没有正特征向 《• 

4 . 如果是不可约的，证明，当 m - cc 时，矩阵•的各元一致 有界. 

5 - 我们已经证明，不可约矩阵有正 Perron 向敏. 假定 A > 0 , ^(^>> 0 , x ^ 0 f * r 关 0 目. 
Ax = p ( A ) j ：； 证明，如果 * r 不是正的，则 A 是可 约的. 如果 * r 是正的， A 就一定不可约吗？ 

6 - 假定义> 0 是不可约的，且与 A 可交换.如果 a •是 A 的 Perron 向 M ， 证明 Rr = 
p ( B ) x . 提示： 定理 （ 8 . 4 . 4 d ). 

7 - 说明多项式/一 1=0 的友矩阵是 々 X 々非负矩阵有 々个极 大模特征值的 例子. 验证这些 
特征值在复平面中的位冒. 

8 . 设々,，匕，~是给定的正整数.说明如何构造一个非负矩阵使得它的极大模特征值正 
好是々> 个怂 次单位根，々 2 个 h 次单位根，…，以及心个々，次单 位根. 

9 . 如果不可约非负矩阵 A 有々> 1 个极大模特征值，说明为什么称 A 为指标 々的 循环. 

10 . 如果是不可约矩阵，并且还是指标 k ^\ 的循环，证明特征多项式 p A ( t ) = 

/，（ 〆 _ 〆 々)*)(/*一¥)•••( 〆 一 〆 „>,其中， r , 为某个整数，广是适合丨 <^ A ) 的某 

些复数，/ = 2 ，…， m . 对 />“/) 中零和非零系数的型式作出说明，并且基于特征多项式的形 
式给出 A 只有一个极大模特征值的 准则.提示： 在推论 ( 8 . 4 . 6 ) 的证明中已知，如果史 = 2 tt /々， 


• • • 


a A 是 A 的特征值，则， U 亦是 A 的特征值 ， r = 0， 1，2, 

11. 设 ”>1 是素数.证明，如果是非负的，不可约的和非奇异的，则或者 〆 是 
A 的有极大模的唯一特征值，或者 A 的所有特征值有极大模. 

12. 考察 A =[^ 1_ |,说明一般不可能改迸推论（& 4.8) 而断言， A 的所有幂的主对角元 

- I \J —J 

一 •定都是零. 

13. 如果证明， A 的不可约性只与其零元的位置有系，而与非零元的大小无关. 

14. 如果 A , B 6 M ,, 则 AB 与 BA 有相同的特 征值. 考察匕说明 ， 即使 

A 和 B 是非负矩阵，有可能不可约而 可约. 这种例子说明不可约矩阵可能相似（甚至 
[5171 西等价）于可约 矩阵； 解释这是为什么.同时它说明，仅仅涉及矩阵的特征值的任何条件不能 
最终验证其不可约性. 

15. 设/ \ eM •是给定的不可约非负 矩阵. 证明，只要非负 ， A + B 就不可约，并 

且只要和 B 关0,就有 〆 + 这是 （8. 1. 18>到严格单调性的改进，不过需附 

加不可约性 假定.提示： 如果等式成立，利用(8.4.5)证明衫=0. 

16. 证明可以用下述方式强化 (8.4. 1). 设是非负的， A 设 A 的极小多项式有次数 
m . 证明， A 不可约，当且仅当 </ + A )" i >0. 提示： 考虑 / + A + A 2 + … + A *" i + A " •十…+ 
A "*', 然后用7, A ， …，表示 A •和更高次幕. 

17•设是给定的非负矩阵，考虑在44小二乘意义下求 A 的秩1锻传通近问题：即 
求秩 使 || A-X || 2 = min { || A-V || z s Y ^ M n 有秩 1}. 假定 AA r 的 Perron 根是筚 

根，如果不可约，悄况就是 这样. 为什么？证明这样的 ft 佳： V 是非负的，唯一的 
给出，其中是 A 的 Perron 根，而 v , u ；€ R " 是非负单位向揪，它们分 
別是 AA / 和 AM 相应于特征值 r 的单位特征 向蟥.提示： 利用 （7.4. 中给出的秩1 M 佳逼近的 
特征. 注意 AA 〃 和 A T A 都是实对称半正定矩阵，所以 r , v 和 u ; 的计箅原则上是不太困难的. 

18. 试用习题17求每个矩阵 

. _ ri in 「in ro 01 

A = L 1」， L 1」， Li iJ 

的秩 1 最佳二乘遏近.证明 ， A = /€ M ” 的秩1最佳二乘逼近不唯一：对于任何单位向 
C \ X = 是/的秩1最佳二乘逼近 • 

8.5 素矩阵 

实际上，在 Perron 定理中可能用得最多的结果是定理 （8. 2. 8) 中的极限命题.定理 
_ (8. 4. 4>的证明说明，没有把引理 (8. 2. 7) 应用于不可约矩阵的仅有假设条件是谱半径为唯一的 

极大模特 征值. 因为 a = D U 是有两个极大模特征值的非负不可约矩阵的例子 （并 且对于 

它，不存 在）， 所以对不可约矩阵类作进一步的限制是必 要的； 而最经济的办法是缺什 
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么就假定什么. 

8.5.0 定义非负矩阵称为素矩阵（或本原矩阵），是指它是不可约的旦只有一个极大 
模特征值. 

素件:的槪念属于 Frobenius (1912〉.现4:，采用与定理 （8. 2. 8 ) 相同的证明可直接由引理 
(8. 2. 7) 得到下述极限结果. 

8. 5.1 定理如果是非负素矩阵，则 

= L > 0, 

4 肩- •.* 

其中， /. = J-y * As = p (, A)j 9 A T y = p ( A ) y 9 x > 0 , •、，>() 且 j * 7 . v = 1. 另外，如果 A •-!是 A 的 
特征值，且对每个特征值 A 关 〆 A ) 有 | A I < | A *-, | ，乂如果 I A _-, | / p ( A )< r < l , 则存在 
常数 C = C ( r ， 使得||[户(八广八]，一 U .< CV •对所有爪=1, 2,… 成立. D 

我们现在已经把 Perron 定理的所冇结果从正矩阵类推广到非负索矩阵类.但是，实际上 
仍然需要解决验证一个 Q 知非负矩阵的素性问题，从理论上讲，可能希望不直接计算特征值就 
能做到这 一点. 下面的素性特征诱导出几个有用的准则 • 而其特征仵计算上并不是有效的检 
验法. 

8. 5.2 定理如果是非负的，则 A 是家矩阵，当11仅当对某个 m 多1成立. 

证明： 如采 A >0, fL . A ->0. 则从 A 的有向 Mr ( A ) 的每个结点尸到另一个结点 C 一定 
存在一条 K 恰好为 m 的冇向道路 （ 推沦 （6.2. 18>>. W 为这是比不可约性更强的性质，所以/\ 
—定不可约.像在 (8. 4. 3) 中那样应川 Perron 定理 （8.2. 11 d , e ), 则推出 A —定是索的.反 
之. 如果是家矩阵.则根据定理 （8. 5. 1) 冇 limlpM ) ' A ] m = L >0 f 11对某个 /«>] 必定有 
Lp ( A ) l Ay > o . □ 

现在联想起不可约性的 ra 解准则 • 上述特征连 Mil 有的关于非负不可约矩阵的极大模特征 
值的非常强的信息给我们提供了素性的图解 准则. 我们知逬，正整数序列々，，々 2 ,…的最大公 
因子 （ g . c . 丄> 是使々 为所有匕，…的因子的最大整数 々>1. 

8.5.3 定理设 A 6 M ， 是不 SJ 约非负矩阵，设彳表示有向图 r ( A 〉 的结 点集. 用 L , = , 

k 2 ] . …} 表示 r ( A > 中起点和终点都在结点 p ( , = 丨 • 2 , …， / I )的所有有向道路的长度 集合. 
用片 ，表示 L •中的所有 K 度的最大公因子.则 A 是素矩阵，当且仅当所有仏 =1 , /=1 ， 2 , 

••• t n. 

证明： 我们知道，因为 A 不可约，所以其长度的集合 L •非 空； 对每个，•和任意 ; •关,•，在 
r (/ v ) 中有一条连结 r 到 p , 的道路，同时在厂(/\>中也有一条连结 p , 到卩的道路. 如果 a 是 
素矩阵，则根据定埋（8.5.2)，存在某个使得/\，>0,因而对所有有 A ^>0 •另一 
方面，对所有/=〗•…，'/， 有 m，m + 1, m + 2、 … d , • 因而片,=1对所有/ = 1，…，《 
成立. 

现在假设4 = [〜] 不是素 矩阵. 如果 A 恰好有 / r > l 个极大模特征值，则由推论 （8. 4.8) 可 
知，对所有 i = l ， …， ”以及所有不是 々的倍 数的//2有三 0. 因此 L , 匚 U ， 2々，31…}， 
W 而仏 对所有 i = l ， …， n 成立. 门 


_ 
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8. 5.4 附注比定理 （8.5.3) 中的论断稍微进一步的结论也 成立； 事实上，总有仏=心=^"= 
心， 而广 个项的公共值恰好是 A 的极大模特征值的个数.这就是 Romanovsky 定理. 

下面的结果在许多场合是有 用的； 特別是它证明了具有正主对角元的不可约非负矩阵一定 
是素矩阵. 

8. 5.5 引理如果 A 是不可约非负 矩阵， 又如果 A 的所有主对角元都是正的，则 

A" '>0. 

证明：如果(!=111比{« | |，“22 •…， a Hm } • 乂如果定义 
5.17j B = A — diag(ii,i ， “” ， ••• ， ti„ ) ， 

则 B 是不可约非负矩阵（因为 A 是不可约的），且十 B = a [/ + ( l / a ) B ], 因而由引理 
(8. 4.1) 可知， A " '^-'[/- fd / a )^ '>0. □ 

练习试说明，当对具有正对角元的非负方阵取升幕时，变成正元的任何元在所有各次幂 
中仍然 M 正的. 

虽然不可约矩阵的幂可能是可约的， m 是素矩阵的所有幂都是索矩阵. 

8.5.6 引理设 AeiVl 是非负家 矩阵. 则对所有々=1，2,…， A * 是不可约非负索矩阵. 

证明： W 为 A 的所冇充分大的幂是正的，所以对任意<•， A * 也是 正的. 假如对某个々， A * 
是可约的，则 V 的所有幂也是可约的， W 而不可能是 正的. W 为这与 A 的所有充分大的 W •是 
正的枣实相矛 ; S , 所以对 A 的任何次幂都不可能是可约的. □ 

从计算 h . 考虑，定理 （8.5.2) 中的特征本身不是验证家性的有效方法 • 因为要计算的幕没 
有给出其 上界. 如果求出 m 使 A ”>0, 则 A 是索 矩阵； 但是，如果我们还没有得到一个正幂， 
耶么什么时候终止这种计 笄呢？ 下述定理给出的有限界间答了这个问题. 

8. S .7 定理设是非负 矩阵. 如果 A 是家矩阵，则对某个正整数— 1),," 有 

A*>0. 

证明： 因为 A 是不可约的，则在 r ( A ) 中存作从 ( Vi 点厂冋 到结点的有向道路：这样的 
K 短逬路有长因此矩阵 A 〜在 它的 K 1位 Wf M n 元，并且 A * •的任意幂也将有正1，1 
元. 因为 A 是素的 • 由引理（8.5.6>可知 A * •-定不可约， W 而在厂(/\〜）中一定 存在从结点卜 
IhJ 到结点 P 2 的有向道路；这样的最短道路有长因此矩阵有正〗， i 元和 
正2, 2 元. 这个过程可沿主对角线继续进行下到得到矩阵 A *，*:"*" (其中每个《„)为止， 
_ 这个矩阵是不可约的且有正对角元，因而由引理（8.5.5>可知因为 

kokz'^k^in — 1 ) ^ /I • w … w(ti — 1> = / ，（ w— 1 )， 

所以 证毕. 口 

如果 A 是给定的素矩阵， 使， >0的最小々称为 A 的本原 指标，通常记作 y ( A ). 我们已 
经看到，如果 A 有正对角元，则 y ( A ><« —丨，而在一般情形下有 y ( A )< w M (w — 1), 后一个界 
可以得到显著改进. 

8. S .8 定理设是非负素矩阵，且假定 r ( A ) 中的最短简单有向回路有长.、•.则 

A “心 2, >0,即 〆 A )<« + . 、•(；!一 2). 
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证明： 因为 a 是不可约的，所以 r ( A > 的每个结点落在一条回路上，且从任一结点回到自 
身的最短回路将是长度至多为 n 的简单回路.经过一个置换，可以假定，在这条最短回路中的 
结点是 P " 户 2 ，…， P ” 注意到 —2)=； i _5+ K «—1) 且考虑 

把 A "~ 写成分块形式 



Lx ?1 



x 22 



其中 XueM , 和 x 22 6 紙 W 为结点 P ,, …，厂组成 r ( A > 中的一条回路，所以；在每一 
行至少有一个非零元，因而从图八 A …）中的每个结点 R 到中的某个结点 P〆 或许 R 
=尸>存在某条弧；如果1</, j < s , 这是成 立的. H 为从不在上述回路中的每个结点 
…，/\，到该回路中的某个结点，在中一定有一条长不超过(它们是不在该回路中 
的结点数）的有向道路，所以在 X 2 I 的每一行中至少有一个非 零元. 当绕着回路走了足够多的 
附加步数时，从不在该回路中的每个结点到该回路的某个结点，显然在 r ( A ) 中恰好有一条长 
恰好为《 — 5 的有向道路. 

现在把 （ A )- 1 写成如下的分块形式 


( A . 广 1 


' V ,. 


【:]， 


其中， v „ eM ,, ifif v ?2 eM M ... 因为尸,，…， p •组成 r (/\) 中的一条回路，所以在 r ( A *) 中 
的每个结点 h ， …， P , 有一个圈.因为 A 是素矩阵，所以 A •也是素矩阵，因而是不可约的. 
从 r (/ v ) 的每个结点 p, ，…， p •到任意其他结点，在 r ( A *) 中有一条长至多为 n - i 的道路. 
首先绕着起点的圈走足够多次，便酊以构造这样一条恰好为 w — i 的道路.这说明 Y „>0 和 
Do . 


[5 T 9 


为了完成证明，算出 


，（ A，r 


- x „ 

- X 21 


U「Vu 


X” 




v 2 J 


r x „ v „ 

-XnYu 


x u y 12 

X ?1 V 12 


W 为在后一个表示式中的 X 子块的每一行至少含有一个非零元，乂因为在后一个表示式中的 
每个 Y 子块都是正的，所以整个分块矩阵是正的，且々•-*</\*广- 1 >0. □ 

<8.5.8>的一个推论是[^. WieUnch 的著名结果，它给出了一般的素矩阵的本原指标的准 
确上界. 


8. S .9 推论如果是非负矩阵，则 A 是素矩阵，当且仅当 A ” l - 2 ” f 2 >0. 

证明： 如果 A 的任意幂是正的，则 A 是素矩阵，所以，我们只要考虑逆命题.如果”=1， 
结论是显然的，因此假定《>1.如果 A 是素矩阵，则 A 是不可约的，且在厂 ( A ) 中有若干条 
回路.如果 r ( A ) 中最短的回路有长〜则厂(>\)中的每条回路的长是„的倍数，因而由定理 
(8. 5. 3) 可知， A 不能是素矩阵.于是厂(汲〉中最短回路的长 是”一 1或者更小，因此根据定理 
(8. 5.8>有 

y(.4) < n4-.v(w — 2) < w-f (« — l)(n — 2) = n 2 — 2n2. 口 




Wiclandt 给出的一个例子（本节末习题 4) 说明，界 y ( A )< w 2 —2 n + 2 是所有对角元全为0 
的矩阵的最佳界.我们知道，如果所有主对角元是正的，则 A 是素矩阵，当且仅当 
如果某些主对角元为正，可能不是全部主对角元为正，则 HoUaday 和 Varga 的下述结果利用 
定理 （8. 5. 8>中所采用的证明思想给出了关于本原指标的一个界. 


8.5.10 定理设 A 6 风 《是不可约非负矩阵，且假定 A 有 c / 个正主对角元，.则 
A 2 ”" '>0； 即 y ( A ><2 /i — 

证明： 在所述假设下 ， A — 定是素矩阵，&在中极小长冋路有长1,实际上有 d 条 
这样的间路.通过置换，可以假定尸,，… • 厂是厂 （ A ) 中的具有圈的结点.考虑 A 2 "— ^ = 
5201 A M \ R 记 

,a - = r Xn x,2 i, A- = r y,1 y,2 i, 

Lx 21 x :2 J Ly ” y 22 」 

其中， X u ， y "6 A^，Ifii X , 2 , Y 22 eM Hj . 采用在定理 （8.5.8) 证明中的相同证法来处理 A "-* 
和（今>” ^的对成位孜的 f 块便可证明，子块\,,和，的每一行至少含有一个非零元， 且子块 
Yn 和&是正的.由定理 （8. 5. 8) 中所运用的相同推理可知，乘积是正矩阵. 口 

练习证明矩阵/\=|^ ^足索 矩阵. 它的特征值是什么？计算由 （8.5.9) 和 （8.5.10) 给 

出的关于 y ( A > 的界. y (/\) 的 W 确值是 什么？ 

作为 最后一 个附注 • 我们指出，如果想证明一个给定的非负矩阵是家的 • 则可以验证该矩 
阵是不可约的 H . 满足 Wiclandt 条件 （8.5.9 h fr : 实际中出现的矩阵常常有特殊的结构，使我们 
容易枵出相应的舟向 图是不 是强连接的.另外，如采任一主对角元是正的，则该矩阵一定是索 
的. m 是，如果矩阵很大 • IL 没有特殊的结构或者其元素没有什么对称性，或者如果所有主对 
角元 是芩， 则可能 黹要利 用定理 （8. 4. 1>或推论 （8. 5. 9) 来验证不可约件或素性.在这两种悄形 
下，如果将 所述轵 阵反复7•方若 T 次 S 到所得到的幕超过临界值（分別为”一1或 Y _2 w + 2> 为 
止， 则矩阵乘法所需要的次数将大大缩小.例如，如果 w =10, 则计算 （/ + A > 2 , ( I - hA )\ (/ 
+ A 广 和 （/ + A ) 16 足以验证不可 约件： 这是‘丨次矩阵乘法而不是良接应用引理 （8.4. 1>所需要 
的8次 乘法. 类似的，如果/\是非负的，則汁 IT . A 2 , A *， A 8 . A 16 , A 32 , A “和 A 12 * 足以验证 
素件；这是7次矩阵乘法而不是81次 乘法. 注意在这些讨论中我们未指明利用了习题 3. 

习題 

1. 写出定理 （8. 5. 1) 的证明. 

2. 若是非负蒺矩阵，证明对所有1，）=1，…，有 lirnh :；"，] 1 —试把这 
_ 个结果与推沦 （5. 6. 1彳）作一 比较. 可以省略掉有关素性假设的那二部分吗？ 

3. 证明，如果 A >0 和 A *〉0, 则 A ">0 对所有 成立. 如果 A 是索矩阵，则对任意 
正整数々， A * 是素 矩阵. 但是，如果 A 和 B 都是索矩阵，则可能 A 13 不是素矩阵.提 示：考 

ml 1 】]和「° ]•• 

Li 0 」 Li 1」 

4. 试用八 A ) 证明，对 Wielandt 矩阵 



是不可约素矩阵.然后证明的 （1 ，】> 元是零而 提示： 把泌看成作用在标 
准基 U ,, …，上的线性变换.那么 A : d A --： e ，? … ■": e ,-? 

5 •设 A 6 M ,, 是不可约非负矩阵.证明，如果至少有一个主对角元是正的，则 A 是索矩 
阵.证明这个充分条件对 /i = 2 是必要条件而对 n ^ 3 则不是. 

6. 设 A = [“， 是非负的，11假定 w 〉0 对某个 ife = l ， 2,…，《 成立. 证明 A 的每 
个幂的々，々元也是正的.如果的 / r , 々元是 正的， A 3 的々， 々元 是正的吗？ 

7. 详细验证本节末提出的简便算法. 

8. 如果 A 是任意 W 等矩阵，则 A = limA ' 证明，如果 Afe 非负的，不可约的和幂等的， 

m f 

则 A 是秩丨的正矩阵. 

9. 始出例子说明，即使 A >0 不是家矩阵， limL ^. A ) 1 A ]_ 仍可能存 在. 实际上，/\可 

h9 •••• 

能是可 约的，还可能有极大模®特征值. 

10. 证明定理 （8.5. 1>的 F 述部分逆 命题： 如果/是非负钔阵和不可约矩阵，乂如果 

J/rnL^/l) 存在，则 乃坫蒺矩阵.提示： ill* \ f, I =p(A), fi Az=^z, z=^ 

0, 则[>(/\> • A]k —? 

11 •证 明. A =\° 是不可约的，仿干是可约的.这与 （8.5.6) 矛®吗？ 

-1 U J 

12. 给出一个不可约非负矩阵 AeM 。 使得 limCyA )、4 T " 不存在. 

13. 如果 e >0, 乂如果是非负不坷约矩阵，证明 A + e / 是索矩阵. 

14. 非负矩阵 △ = [“,>] 称为组合对称的，是指 “ y >0 当11仅当〜 >0对所有/,) = 】，•••， 
”成立. 证明，如果 A 是组合对称的素矩阵，则 A>〃>0. 提示： 考虑 A 2 丘利用 （8. 5. 6) 和 
(8.5. 10). 你能给出关于厂 < A > 的回路结构的更多的信息来改进 y ( A ) 的界吗？ 提示： 利用 
(8. 5.8). 

15. 证明，如果/是非 负的. 不可约的和非奇异的，且7；是素数，则或者 （ WA 是索 
矩阵，或者 （ b > A 的所有特征值有极大模 R A 相似于，一 〆 A >_=0 的友矩阵. 

16. —种计算非负矩阵的 Perron 向嫩和谱半径的方法是 幂法： 

- r <0> 是任意正向 tt , tx : u> = 1; 

f-l 

对所有 ", = o.l ， 2 , … 成立； 



Sf ， 


对所有 w = 0，1，2,…成立. 


如果 A 是索矩阵，证明，向的序列收敛于 A 的（右） Perron 向摄，而数乏的序列 

»-1 

收敛于 A 的 Peircm 根.其收敛速度如何？关于素性的假设是必要的吗？ 

17. 如果是非负的，证明 A 的素性只与零元的位置有关而与非零元的大小无关. 

18. 如杲是非负的、不可约的和对称的，证明 A 是索矩阵当且仅当△+ 〆 々>/是 
非奇异矩阵.特别是，如果 A 是半正定矩阵 • 这个条件被 满足. 以0和1为元素的对称非负矩 
阵常常作为无向图的邻接矩阵而出现. 

19. 如果是素矩阵且 Oy ( A ), 证明 A *>0. 

20. 给出定理 (8. 5. 10) 的证明细节. 

21- 计算下列各矩阵的特征值和特征向 M ， 并且按本章的基本概念（非负矩阵、不可约矩 
阵、 * 矩阵、正矩阵等)进行归类：[】 0 ]，「 0 ]， I " 1 0 ]，「 0 

Li 1」 Li 1」 Li 1 」 Lo 】」 Lo 0」 Lo 0 」 

[° 0 这些矩阵为可能出现的各种可能性提供了好的实例. 

22. 在定理 （8.5.8) 的证明中，证明 X ,,和：的每一列至少含有一个非 零元. 证明 y 2l 

> 0 . 

进一步阅读关于 （8.5.4) 中提到的 Romanovsky 定理的证明可参看 V . Romanovsky , 
**Recherches sur les Chaines de Markoff Math . 66(1936), 147-251. 

8.6 一般极 限定理 

即使非负矩阵 A 是不可约的， A 的标准幂却不一定有极限，以矩阵 


厂0 n 

一 Ll 0- 


为例就不难说明这 一点. 尽管如此，在按平均值计算的确切意义下，这个极限的确 存在. 

8. 6. 1定理设不可约非负矩阵.设九 r = p ( A ) i , A r y = p { A ) y y = l 和 [ 
• r ， •则 

把 ^S[/><A)-Aj- = L. 

此外，存在有限正常数 C = C ( A ) 使得 




对所有 N = l ， 2, …成立. 



证明： 如果令且选取: y 和 * r 分别为 A 的左和右 Perron 向贵，则引理（8.2.7> 的 
假定 （1) 一 （5) 被满足，因而矩阵 

I-[p(Ar l A-L^ = p(,Ar l lp(A)I - (A-p(A)U^ [524 

是可逆矩阵.利用引理 （8. 2. 7) 的 （ e ) 和本节末的习题1中的恒等式可算出 

m=l 

1 V 1 N 
^jj^dpCAr'A-Ly + L) = L + jj^Zp(Ar l A-Ly 

= L + •^<〆A 广 ■A-U</-[>(A 广 , A — L ： ^{/-I>(A^ I A-L]} , 

=L + jj{p(Ar l A-L)\l-[.p{A) ’/\] v + u<J-0(A)- | A-xjr , . 

仵后一个表示式中与 N 有关的部分只有第二项的因子 1/ N 和项 0( A >1 A ] N ， 但是根据推论 
(8.1.33), 当 N -^ oo 时，矩阵 [ YA ) 各元一致有界.因此，当 N - oo 时，第二项的数嫩 

级为 1// V , 因此它一致趋于零. □ 

分析一下引理 (8. 2. 7) 和 （8. 1.23) 所需假设条件可知，相同的证法恰好证明下述更一般的 
(但叙述起来并不简 短的） 结果. 

8.6.2 定理设 >\ eM w 是非负的，且设 * r 和 ： y 是使和的非负向 M . 

如果 

( a ) 尸(/\)>0; 

(b) j* t ^>0 ； 

( c ) 矩阵 

7 - [pCAr'A- U T yr l xy T l 

是可逆的； 

( d ) 当 oo 时， 一 致 有界； 

则 

lim 士 = ( - r V ) ' x y T - 

另外，存在有限正常数 C = C ( A )， 使得 

对所有 N=l, 2 , …成立. _ 

习题 

1. 如果且/一召可逆，证明 
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2 抄 ，= BU - B S )U - B) 


提示： 乘以 l - B . 

2. 证明定理 （8. 6. 2). 

3. 试比 较定理 （8.5. 】> 和（8.6.1〉的收敛 速度. 给出一个例子，说明 （8.6. I )中的收敛速度 
不可能改进. 

4. 假定是不可约非负矩阵，且 = w = l , 2,….试用定理 （8. 6.1) 证 

明，对每个给定的数对（ I ， _/)• “^>0对 m 的无限多个值 成立. 这个结果可以看作定理 
(8.5. 2> 的 推广. 给出一个例子，说明也有// I 的无限多个值使得 

5. 在定理 （8.6. 2>的假设条件卩，证明，只要数对 （/,)) 使心，关0,则对 w 的无限多个 
值有《广>0.这个结果为什么包括习题 4. 

6. 当 A 是索矩阵时 • 直接证明定理 （8.5. 1)茧涵定理 <8.6. 1). 提示： 这里所需要的是证 
明从分析中得来的 F 述 结果： 如果序列收敛于冇限极限，则它 Cesaro 可和于同一极限. 

7. ^]. S 接计算 

•V 

li _ m N ' 

冉计算用定理 (8. 6. 1) 给定的这个极限值，然后迸行比较 • 

8.7 随机矩阵和双随机矩阵 

如果非负矩阵的所冇行和是】•则具有这一性质的矩阵称为 （行） 隨机矩阵，这是 
因为毎一行可以矜成有〃个点的样本空间上的离散 W 宇分 布.列随机矩阵趄行随机矩阵的转 
捋；这样的矩阵常常出现在（8.0>节中所讨论的城市间的人口流动模 咽中. 随机矩阵还出现在 
_ Markov 链的研究中以及象经济学和运筹学这类领域的各种各样的数学模型问 题中. 

中的随机矩阵的集合是紧凸 ft , 外且具有简单而乂要的 性质. 如果表示所 
有分 W 为+丨的向拚，非负矩阵是随机矩阵，当且仅当 = 所以，从中的随机矩 
阵构成一个容易识別的非负矩阵族， fl 它们有一个特殊的正的公共特征 向量. 有正特征向莆的 
非负矩阵 II 有许多特殊性质[例如 •（8. 1.30>, (8. 1.31>和 （8. 1.33>], W 此所有随机矩阵具有 
这些忭质. 

如果随机矩阵 AeAt 的转普 • A 7 也是随机矩阵，就称八是双隨机矩阵；所有行和与列和 
都是+1_双随机矩阵的集合也是 Ai w 中的紧 凸集. 显然，非负矩阵 A 6 M ,, 是双随机矩阵，当 
且仅当 Ae = e 且 〆 在（6.3.5> 中已经遇到过一种双随机矩阵形式 • 即正交随机矩阵 
A = [ | u „ I 2 ], 其中 = 是酉 轵阵. A 的行和与列和都是 + 1 可从 c ； 的行与列都是 

Euclid 单位向 M 的事实推出. 

双随机矩阵的另一个例子是肾换矩阵组成的集合（群由 Birkhoff 定理可知，任一双随机 
矩阵是有限多个置换矩阵的凸组合，因而置换矩阵实际上是基本的和标准的双随机矩阵•我们 



给出的关 f Birkhoff 定理的证明依赖于以下事实（见附录紧凸集 S 中的每个点是 S 的诸端 
点的凸组合.我们将证明，双随机矩阵的集合的端点恰好是置换矩阵. 

8.7.1 定理 （ Birkhoff ) 矩阵是双随机矩阵，当且仅当对某个存在 S 换矩阵 
Pi ，…， 和正纯 M ai • … • av € R » 使得 ai + … — av = l ft A = ai Pi + …+0：\尸 v . 

证明： 条件的充分性是显然的；我们只需证明其必要性.设 A = [> y ]6 M N 是给定的双随 
机矩阵 . 如果 A 是置换矩阵，则在它的每一行和每一列恰好有一个元素+1，而所有其他元均 
为 0. 如果可以记 + 其中， 0< ai , a 2 < l , a ,+ a 2 = l , 且仏 C 是双随机矩阵， 

则 W 为％ 和心都是非零元且 c * v 是非负元，所以与 A 的0元〜=0相对应的 B 和 C 的每个 
元一定适合 0 = 因而〜 = r ,,=0. 由于 B 和 C 是双随机矩阵，所以它们的各 

个行和是+ 1， 因而 各非零元一定都是+1, fl 与 A 的各非零元处在相同的 位置； 即 = C 
这就证明了每个置换矩阵是双随机矩阵集合的端点. [527| 

另一方面，如果 .4 不是置 换矩阵 • 则至少有 A 的一行，例如第/行，它至少含两个非零 
元. 在该行中选取任一非零元 a ， W 为在第/•行中至少有两个非零元且该行中的所有（非 负） 

I m 

元之和是+ 1,所以“ V2 •定适合由于 0<« V : <1, 且第列的所冇（非苓）元之 
和是+ 1，所以在所在的同一列，一定冇另一个非芩元, 13#/, * 且 0< Ci V 2 < l . 根据 
N 样的推理，在〜:所在的同一行，另有一个 t •零元14且 0 <« V < < 1 /如果把这个 
过程继续下去， ti 对用这种方式依次选出的各元加上标号，则经有限多步，原来选定的元索 
〜会 t 次冉被选到. 从第一次出现元素心立到第二次冉出现“，的过程中，诸元索组成的序列 
(包括第一次出现的元〜 • 但不包括第二次出现的元〜）是 A 的元素的有限有序序列，且其中 
每对相邻元在同一行或同一列交锌出现；设是这个序列中的《小（正） 元. 设 ii € iV / n 是这样 
一个矩阵，在 B 中，出现在与序列的第-个元相对应的位*，一〗出现在与序列的第二 
个元相对应的位置，+1出现在与序列的第-个元相对应的位萏，依此类推，交替地选取士 1. 

H 的所有其他元是 0. 注意. H 的所有行和与列和是 0. 设 A , + 及 A . — 

注意， A + 与 A 都是非负矩阵（因为⑷,的极小 忭）， ii 它的行和与列和珐+】（因为 Z 3 的行和与 

列和是 0), 所以泌 + 和4是双随机 矩阵. 由于 A = + A , + ， 且 A •关 A , 我们得出 A 不 

是双随机矩阵集合的端点. 

刚才给出的证明说明，一个给定的矩阵是双随机矩阵的紧凸集的端点，当且仅当它换 
矩阵. 从紧凸集的每个点是 i # 端点的凸组合的班实可知定理成立. □ 

因为在中恰好有，;！个互不相间的置换矩阵， Birkhoff 定理保证，任意双随机矩阵可 
以表示成至多 /V = n ! 个晋换矩阵的凸 组合. 更细致的分析说明，所需置换矩阵不超过 = V 
一 2 w + 2 个. 

习题 

1. 设是非零非负矩阵，且有正特征向乂设 D = diag ( x ,, …，心>，证 
明广二 〆 々）：^)，由 （8. 1.30) 可知九且 y \ Z >= 〆 ^， 其中的所有元是+ 1，由此得_ 
出， A (经具有正主对角元的对角相似矩阵 〉 相似于随机矩阵的正倍数[即 〆 A 〉]. 这个论断使我 



们把许多有关具有正特征向 M 的非负矩阵的问題化简成有关随机矩阵的 问题. 

2. 证明 At 中的随机矩阵的集合与双随机矩阵的集合是紧凸集. 

3. 证明中随机矩阵的集合与双随机矩阵的集合各自在矩阵乘法下构成一个 半群； 即如 
果 A ， 是 （双〉 随机矩阵，则 A/3 是（双）随机矩阵. 

4. 证明，非负矩阵是随机矩阵，当且仅当 

5. 证明 2 X 2 双随机矩阵是有相同主对角元的对称矩阵. 

6. ( a) 试用 （8. 7. 1) 的证明中所采用的想法但不用附录 B 的结果，给出 （8. 7. 1) 的另一个直 
接证明， （b ) 然后给出一个算法，把一个双随机矩阵分解为置换矩阵的一个凸组合.提 示：如 
果 A 不是 S 换矩阵，利用证明中所表述的诸元素组成的序列作一个置换矩阵，从 A 减去这个 
置换矩阵的正数倍就得到一个有相同行和与列和的非负矩阵，且它至少有一个非零元.于是， 
在这个矩阵上 重复上 述过程 R 继续做下去. 

7. 证明 （8. 7.1) 中的分解是不唯一的. 

8. 如果双随机矩阵 A 是可约的，证明 A 实际上置换相似于形如「= 的 矩阵. 关于 

A , 和 A 2 能说些什么？ 

进一步阅读定理 （8. 7.1) 的证明思想取 ft B . Saunders and H . Schneider , “Applications 
of the Gordon-Stiemke Theorem in Combinatorial Matrix Theory ,” SMM Rev . 21 ( 1979), 
528-541 , 从中可找到有关的 事实. 每个双随机矩阵至少是 n 2 — 2 n + 2 贸换矩阵的一个 
凸组合，该结果的讨论可参符 M . Marcus and R . Rcc . “Diagonals of Doubly Stochastic 


, 295-302. 


附录 A 复 数 


一个复数有形式 

Z = “ + 必， 

其中， U 和 A 是实数，而/是满足关系 〆 一一 1的形式符号.实数《称为: T 的实部， i 己作 Reu 
实数6称为 z 的虚部 • i 己作 Im z . 复数 z = a 十泌的复共 fez 是 ： r =“一 i 7». 如果 q =〜 + A 和 
z 2 = a 2 + ib 2 是复数，则其加法和乘法的二元运算通过实数的相应运算 fi 然定义为如下 形式： 

Zi -b z 2 = (tii + Us ) + i ( b ' + z 2 = a \ U 2 — b 、 h z + i ( aib 2 f a 2 bi ). 

W 此，加法是实部和虚部分别相加的结果，而乘法是代数展开及关系/ 2 = — 1的结果.===“ + 

泌的加法逆是一2= — A ), 而当 z ^0 = 0 + /0 时，2：的乘法逆是 

_1_ _ U — ib _ a , ./ •- b \ 

复数^和^的减法和除法定义为 

Z \— Z t = z , -f (—?；)• — = 2, ( z ") = 

z z \ Zz / Z 2 Sz 

所有复数的集合记作 C : 加法和乘法运算是可交换的，并 RC 在这些运算下构成一个域，以实_ 
数 0 = 0 + /0 为加法单位元，以实数丨 = 1 + iO 为乘法单 位元. 实数域 R 构成 C 的一个 子域； z 
的绝对值（或模），记作丨 H ，定义为丨 z I = + Uz > 12 ,它总是一个非负 实数. 如果心关0, 

则商 A / h 为 （1/ I A 丨 Z )A ^容易验证.乘法运算与复共轭是可交换的，& = 2 , R 

复共轭的复共轭乂是原來的 g 数. 因为 Ke z =( l /2) U +： c > 和 lm z =( l /2 />U — z )， 所以实数 
就是使 lm 2-0 的那样一些 z 6 C , 或等价地有 e = e ( = Rez ). 

儿何上，复数域 C 可以看作一个具有原点0,一条“实轴”和一条“虚轴”的平面.因此， 

C = « + A 可等同于有序偶（《、实轴 U : lm 2 — 0} 就是通常的实线，而虚轴 U : 1^ 2 = 0>就 
是实线的 |倍 或所有“纯虚”数.到实轴（虚轴）的投影是 Re zGlm 复共轭是经实轴的 

反射. 且 I z I 是复平面中原点到 2 ：的 Euclid 距离. C 的幵（闭）右半平面是 U 6 C : Re z >(^) 

0>. 而 C 的开（闭） 上半乎面是 U 6 C : lm z >(^) 0 }. C 的单位 圓盘是 | sr |< U ，而 
以 r 为半径，以为中心的圆盘是 uec : | z-ti ! < r (. 

上一 段用直角坐标 描述了复平面 C . 同时复平面也可以有效地用极 坐标来 描述，在 
平面的位置由 r 和0所确定，其中「是 2 所在的以原点为中心的岡的半径，而0是按反时针方 
向从实线正向转到 z 所在的从原点出发的有向射线的角度.于是 z 的极坐标为 （ r ， 0)，并且通 
常用记号来表示，其中 〆 ecos 沒 +/ sin 庆因此，如果 z =^ +，6 为直角坐标，且 z = r 〆 
为极坐标，则从极坐标到直角坐标的变换是 

a = rcos ^. b = rsin ^. 



而从直角坐标到极坐标的变换（当 r ^ O 时）是 


5T2j 


r = I z \ — ( a ' -¥ b z Y 2 , d — arc sin — = arg z % 

这里，我们一般取 O <0<2 ir . 岡形对象常常容易用极坐标来描述.例如， 

{ re e ： 0«1， 0^<2 tt >. 


中的单位圆盘是 



附录 B 凸集和凸函数 


设 v 是含有实数的一个域上的向*空间. v 的一组选定的元索％，…，的一个凸组 
合是其系数非负且和为 1 的线性 组合： 

裊 

ai 功 + •• •十 a k v k ; ai ，“ • , a k ^ O ^ y ] a ,=】• 

f 

V 的子集 K 称为 凸集， 是指从 K 中任意选定一组元素所作成的任一凸组合仍在 K 中. 等价 
地， K 是凸集，是指 K 中各个点偶的所有凸组合仍在 K 中.几何上，这可以解释为连结/<的 
任意两点的线段必定在 K 中； 即 K 没有“凹”或“ 洞”. 一个凸集 K 称为 凸锥， 是指每当 《>0 
和 1 €尺，就有等价地， K 中元素的正线性组合仍在 K 中）.直接验证可知，两个凸集 
(相应地， 凸锥〉 的集和及交仍为一个凸集（相应地.凸锥）. 

—个闭凸集 K 的一个硪点是这样一个点 ze / C , 它只能用一种平凡的方式写成 K 中点的一 
个凸组合，也就是说， z = ax -{-(\- a ) y , 0 < a < l , x , > 6K , 蕴涵 1 = 7 =^. —个闭凸集可 
能有冇限个端点（例如，一个多面体 >• 也可能有无限多个端点（例如，一个闭阏 盘〉， 还可能无 
端点（例如， R 2 中的闭上半平面）.然而，一个紧凸*总有 端点. V 中点的一个集合 55 的凸包， 

记作 Co ( S )， 就是选择 S 的所有点组作成的所有凸组合的 集合. 或等价地，它是包含 S 的（所 
有凸集的交） 《 小凸集. Krein - Milman 定理是说，一个 紧凸集 是它的端点的凸包，我们说一个 [533 
紧凸集是 有限生 成的，是指它有有限多个端点，这些端点称为该凸集的生 成元. ~ 

现在假定 V 是具有一个给定范数的实或复向址空间，分 离超平面定理 是说，对于两个不 
相交的凸集和存在 V 屮的一个超平面 H , 使得 K , 位于由 H 确定的两个闭半 
空间中的一个内，而^位于另一 个内； 即 H 分离/^和/< 2 . V 中的一个 超平面 H 正好是 V 
的一个一维子空间的正交补的一个 T 移： H = U6V ： (/>= 0 >,其中， （/6 V 是给定的 

向 M , c /^0 . 超平面 n 确定两个开半 空间： H + ={ x € V ： U — p ， q » 0 ), H ={ xeV ： { j : 

一 P , q )< 0 ). 集合和 UH 是由 H 所确定的两个闭半 空间. 因此，分 
离意味着对某两个向 M />， q 有 K 二出 和对两个凸集附加某些条件就会有各种强 
化的分离结论.例如，如果 K , 和的闭包不相交，那么分离可以取得更为精确 | 即 
fT ， K 2 QH -. 任一有界集 SCIV 的凸包的闭包可以通过取包含 S 的所有闭半空间的交而 
得到. 

在 V 是具有复内积<•， • >的向 M 空间 C " 的情形，也玎以类似地定义超平面和半空间， 

只是必须把 C ” 和 V 等同起来•且必须用下述实内积 R e < • ， •> 代替〈•， •>. 将 . r + b € C ” 

等同于 还应注意到，根据复内积的共轭线性性质， 6 十 6 2 〉=〈 4 ， 


> +〈: yi ，： y 2 >. 于是 ( 


> + < 3^1 , % > 是 


-vi 


和的（实）内积，而肢”中定义的超平 


面和半空间在 C " 中有相应的几何解释. 
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附录 B 


我们说定义在一个凸集上的实值函数/是凸函教，指的是对所有 0< a < l 和所有 
K • y 尹 j ， 有 

f((tr (1 —a)_v) ^a/(x) -|- (1 — a) f(y). (*) 

如果上述不等式总是严格的，那么/称为严格凸 函數. 如果对所有 0< a < l 和所有: r ， y eK 9 
上述不等式是反向的，那么/称为凹函数（或严格凹函數，如果反问不等式总是严格 
的）.等价地，一个凹函数（相应地，严格凹函数）正是一个凸函数（相 应地， 严格凸函数）的负 
值.几何上，连结任意两个函数值的弦位于一个凸函数（相应地，凹 函数） 的图象的上方（相应 
地， 下方） • 一个线性函数既是凸的，也是 凹的. 在 V = R ” 和 K 是幵集的情形* Hessian 矩 
M 2 阵为 

它是 M ,,( R > 中的对称矩阵，对于一个凸函数/，在 K 中几乎处处存在，并 M 在使 HQ ) 
存在的 K 中的各个点，它一定是半正定的.在严格凸的情形，它是正定的.反过来，一个函 
数，如果它的 Hessian 矩阵在整个凸集上是半正定（相 应地，正定） 的，那么该函数是凸（相应 
地，严格凸）的.类似地，负定性对应凹性. 

凸函数和凹函数的 W 优化有一些好的性质.在紧凸集上，凸函数（相应地，凹函数）的极大 
值（相应地，极小值）在一个端点达到.另一方面，在一个凸集上，由那些达到一个凸函数（相 
应地，凹函数）的极小值（相应地，极 大值） 的点组成的集合是凸的，并且任一局部极小值（相应 
地，极 大值〉 是全局极小值（相应地，扱大值例如，一个严格凸函数至多 A 凸*的一个点达 
到极小值. ii 一个临界点一定是极小值点. 

实数的凸组合满足某些简单而乂常用的不等式.如果 心是 给定的实数，那么 

t 

min x , ^ /. a . J -, ^ max x , 

对任意凸组合， c »2 ，…，和 a ，+ … + a » = 1 成立. 

研究定义在一个 K 间上的某些简单的单变凸函数 /(•> 可诱导出各种各样的经典不等式. 
我们可以用归纳法证明，定义在区间上的关于两 t 点的不等式 （* ) 可以推出关于个点的小 
等式 

Iff IV 

/( 2 a '* r * n = 2 * 3 , — , ( * * ) 

#»l f»l 

只要 cr ,>0 , ⑴+…+1 = 1,且所有 A 都在区间内. 

应用 （* *> 于区间 （()• oo ) 上的严格凸闲数 /(yt — logi , 便导出加权算术一几何平均值 
不等式 

n m 

^ n j > 0 ， 

! i -1 

当所有 a , = l / w 时，它就是算术一几何平均值不等式 

+ 2 *^ > ( n *^) 1 "，**■•>()， 

n .-I .«i 



凸集和凸函教 
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等式成立，当且仅当所有1都相等. 

把（ * * ) 应用于定义在区间 （0, oo ) 上的/( 0 *> =分， />> 1 , 便导出 Holder 不等式 

2 ^^ < ()' p ( )' 

f-1 •«! i*l 

其中： r ,， 乂 〉0, p > l ， 且 l / p + l /</= l . 等式成立，当且仅当向量 [• rf ] 和 [: y ?] 相关.如果取 
p = (/ = 2, 我们便得到 Cauchy - Schwarz 不等式的另一种形式 

E ^<( Sxf ) ,/2 (2^) 1/2 . 

#*1 «" I 卜 1 

等式成立，当且仅当向贵 [>,] 和 [： y ,] 是相关的.我们珂以从 Holder 不等式推出 Minkowski 不 
等式 

i m I f •動 i—I 

其中 * r •，乂 >0 且 />$1. 等式成立，当 R 仅当向 MLr .] 和[: y .] 是相关的. 

进一步阅读关于凸集与几何的其他资料可参肴 [ Val ]. 关于凸函数与不等式的其他资料 
可参# LBoa 」 和 [ BB 」. 


附录 C 代数基本定理 

促使人们去建立 复数域 c 的一个历史动机是实系数多项式可能有非实的复零点.例如，二 
次公式表明，方程/一 2 j*+2 = 0 有根（解 ） U + f ，1-/}. 然而，任一实系数多项式的所有零 
点都包含在 C 中. 事 实上，当把可能的系数域扩充到 C 时，所有复系数多项式的所有零点仍 
然包含在 C 中.因此， C 是代 教闭域 的一个 例子； 也就是，不存在以 C 为其子域的域 F , 使得 
有 • 个系数取自 C 的多项式，它的根在 F 中而不在 C 中. 

代數基本定理 是说，次数至少是1的任一复系数多项式在复数中至少有一个零点虬即 z 是 
方程/>(1〉= 0的一个 根]. 运用综合除法可知，如果2 是 />(* r ) 的零点，那么就除尽 
即， p ( x )^( x - z ) q ( s ), 其中， </(•!•) 是复系数多项式，它的次数比 />( t ) 少 1. 于是 
/>(* r ) 的诸零点是 (/( J0 的零点及 z . 

下述定理是代数基本定理的一个推论. 

定理 每个次数为 n ^\ 的复系数多项式在复数域中恰好有 n 个根（重根按®数计 算）. 

/>(j > = 0 的一个根的*数是使 （ j •一除尽 />&) 的最 大幣 数々，即 2 作为 p (: r >=0 的根出 
现的次“数 ”• 如果-•个根有*数 3 ,那么在/>(^)= 0 的”个根中，它要褀计 3 次.由此推出， 
_ 每个复系数多项式在复数域上总可以分解成线件因式的乘积. 

不过，如果实系数多项式 />(* r ) 有某些非实复 根， 那么它们必须成 共轭对 出现，因为，如 
果 0 = p (2 ：)， 则 0 = 5 = 由于 

(j- — z) = x 2 — 2Re(z)j- -h| z \ z , 

由此得出，任一实多项式在实数域上可分解成线性囚式和二次因式 的幕的 乘积，而每个不可约 
二次因式对应一对共轭复根. 

[5381 进一步阅读 关于代数基本定理的一个初等证明可参看 [ Chi ]. 



附录 D 多项式的零点对其系数的连续依赖性 

运用复分析不难证明一个重要的事实，那就是，一个次数为的复系数多项式 的”个 
零点连续地依赖于它的系数. 

对于 jec 1 ， 设 /(•!•> = [/, (j> ， … ， /«(x)] T * 其中 /•: f=l, m. 函数 /: 

cr 一 cr 在 a* 连续，是指每个 /. 在 i 连续 ，1 = 丨， … ，讲 . 函数 /,: c"—c 在 x 点连续，是指 
对每个 e>0, 都存在 5>0, 使得只要就有 丨 /ib) —/.(X) 丨 <e, 其中 HI 是 C” 
上的向 M 范数 . 

可以用下面的说法来 g 观地叙述连续依赖的 结论： 把首系数为1的 n 次多项式的〃个系数 
(首系数1除外）与该多项的 n 个零点对应起来的函数/: c "- c •是连续的.可是这里有个难以 
解决的问题，不存在定义这个函数的简单方式，这是因为，在 n 个零点中间不存在定义一个顺 
序的自然方式.我们提出下面的定理，作为多项式的零点对其系数的连续依赖的一个精确 
叙述. 

定理设 il 设 

/)(J>= a„x m -\-a„ 1 f … + … J + U" a„ 

是一个 M 系数多项式 • 那么，对仟给 e >0, 存在^ >()• 使得对任一适 合乂关 0的多项式 

q(x) •- b m x m + b r , j* 1 + …+ 6, «r + 6 0 
和 

max | a, — bi | < 汐， 

我们有 

min max I A> — fi Ti ,» |<e ， 

其中， A ,， …， A „ 是/>(^)的零点，而川，…， w 是按某个顺序排列的 (/( h 的零点，且（极 小〉 
min 取遍1，2，…， w 的所有排列 r . 

W 此，一个多项式的各个系数的足够小的变化只会引起任一零点的一个小的变化，这一原 
理在矩阵分析中有非常 t 要的意义，这是 因为， 矩阵的特征多项式的诸系数是 A 
的各元的连续函数（实际上是多项式 K1 . 2. 11>，且/^(/)的零点是 A 的特征值.因为连续函数 
的复合是连续的， A 的各元的足够小的变化 H 会引起 p . A (/) 的系数的一个小的变化，而它只会 
导致特征值的一个小变化.因此，实的或复的方阵的特征值连续地依赖于它的各 个元. 

进一步阅读关于 P ( h 和 (7 (* r ) 的各零点间之差 € 的显式界可用其系数分离$及其系数的 
大小来表示的问题呵参看 I - Eisner * “()n the Variation of the Spectra of Matrices , M Linear 
Algebra Appl . 47(1982), 127-138. 


附录 E Weierstrass 定理 

设 V 是具有范数|卜||的有限维实或 复向撤 空间.关于中心为半径为 e 的球是 
B t ( j )-={ yeV ： || II < e }. 我们称子集是 开集， 是指对每个 xes , 都存在一个 e 
>0, 使得权 （ I ) es . 子集 rev 称闭集 • 是指 t 在 v 中的补集是开集.子集称为有界 
的，是指存在 r 〉0, 使得 SQi ^( O ). 等价地，了是闭的，当且仅 当了的 仟一收敛序列（关于 
IH ) 的极限都在 r 中，而 s 是有界的，是指 s 包含在具有有限半径的任一 球中. 子集 SQV 
是紧集，是指它既是闭的，又是有界的. 

对于 SGV , —个函数/: S - R 在 S 上可以达到或者不可以达到一个（全局）极大值或极小 
值.但是，在某些常见的情形，我们可以确信 • /在 S 上达到一个极 大值. 

定現 ( w e i erstrass > 设 S 是有限维实或复向被空间 V 的紧子集.如果 /: S - R 是连续函 
数，那么存在点使得对所有有 

/D 

且存在点心„€5,使得对所有有 

/(:) < /(Jm..). 

即/在 S 上达到它的极小值和极大值.当然，可能不止在 S 的一个点上达到值 f ^ ix / Cr ) 和 

如果 Weierstrass 定理的两个主要假定（紧的 S 和连续的/>不成立，结论 i 能不真.是 ， S 
是一个有限维实或复向》空间的子集不是本质的.对于紧集的一个适当的定义 ， Weierstrass 
定理对定义在一般拓扑空间的一个紧子集上的连续实值函数成立. 
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